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本 书 全 面 .深入 地 探讨 了 编译 器 设计 方面 的 重要 主题 , 包括 词法 分 析 、 语 法 分 析 、 语 法 制导 
定义 和 语法 制导 翻译 ,运行 时 刻 环境 、 目 标 代码 生成 、 代 码 优化 技术 、 并 行 性 检测 以 及 过 程 间 
分 析 技 术 , 并 在 相关 章节 中 给 出 大 量 的 实例 。 与 上 一 版 相 比 , 本 书 进行 了 全 面 修订 , 涵盖 了 编 
译 器 开发 方面 最 新 进展 。 每 章 中 都 提供 了 大 量 的 实例 及 参考 文献 。 

本 书 是 编译 原理 课程 方面 的 经 典 教材 ,内容 丰富 , 适合 作为 高 等 院 校 计算 机 及 相关 专业 本 
科 生 及 研究 生 的 编译 原理 课程 的 教材 , 也 是 广大 技术 人 员 的 极 佳 参考 读物 。 

Simplified Chinese edition copyright © 2009 by Pearson Education Asia Limited and China Ma- 
chine Press. l 

Original English language title; Compilers; Principles , Techniques and Tools ,Second Edition( ISBN 
0-321-48681-1) by Alfred V. Aho, Monica S. Lam, Ravi Sethi, Jeffery D. Ullman, Copyright © 
2007 . a 

All rights reserved. 

Published by arrangement with the original publisher, Pearson Education, Inc. , publishing as Ad- 


dison Wesley. 
本 书 封面 贴 有 Pearson Education( 培 生 教 育 出 版 集团 ) 激 光 防 伪 标 签 ,无 标签 者 不 得 销售 。 


版 权 所 有 , 侵权 必 究 。 
本 书法 律 顾问 ”北京 市 展 达 律师 事务 所 


本 书 版 权 登记 号 : AS: 01-2006-6521 


图 书 在 版 编目 (CIP) 数据 

编译 原理 第 2 版 /( 美 ) WE (Alfred,V. A. ) 等 著 ; 赵建华 等 译 . 一 北京 : 机 械 工业 出 版 
#£, 2009. 1 

(计算 机 科学 丛书 ) 

书 名 原文 : Compilers; Principles, Techniques and Tools, Second Edition 

ISBN 978-7-111-25121-7 

I. 编 … LOW- ORK- M 编译 程序 -程序 设计 WN. TP314 


中 国 版 本 图 书馆 CIP 数据 核 字 (2008 ) 第 173435 号 


机 械 工 业 出 版 社 (北京 市 西城 区 百 万 庄 大 街 22 号 ”邮政 编码 100037) 
责任 编辑 : 朱 动 

北京 京北 印刷 有 限 公 司 印刷 

2009 年 2 月 第 2 版 第 2 次 印刷 

184mm x260mm ，40.5 印张 

标准 书号 : ISBN 978-7-111-25121-7 

定价 : 89.00 元 


LHE, 如 有 缺 页 、 倒 页 、 脱 页 , 由 本 社 发 行 部 调换 
本 社 购书 热线 : (010) 68326294 


出 版 者 的 话 


ae 





文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 台 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 人 迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 | 

机 械 工业 出 版 社 华章 分 社 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 华 章 分 社 就 
将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons，Cengage 等 世界 著名 出版 公司 建立 了 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 桔 选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. 
Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry 
L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 了 珍藏。 大理石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 分 社 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华 音 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 ，100037 
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绝 大 部 分 软件 是 使 用 高 级 程序 设计 语言 来 编写 的 。 用 这 些 语言 编写 的 软件 必须 经 过 编译 器 
的 编译 , 才能 转换 为 可 以 在 计算 机 上 运行 的 机 器 代码 。 编 译 器 所 生成 代码 的 正确 性 和 质量 会 直 
接 影响 成 干 上 万 个 软件 。 因 此 , 编译 器 构造 原理 和 技术 是 计算 机 科学 技术 领域 中 的 一 个 非常 重 
要 的 组 成 部 分 。 不 仅 如 此 , 编译 技术 在 当前 已 经 广泛 应 用 于 编译 器 构造 之 外 的 其 他 领域 ， 比 如 程 
序 分 析 / 验 证 、 模 型 转换 、 语 言 处 理 等 领域 。 因 此 , 虽然 大 部 分 读者 不 会 参与 设计 商用 编译 器 , 但 
拥有 编译 的 相关 知识 仍然 会 对 他 们 的 研究 开发 生涯 产生 有 益 的 影响 。 

A. V. Aho 等 人 撰写 的 《Compilers: Principles, Techniques, and Tools》 被 誉 为 编译 教科 书 中 的 
“ 龙 书 ”。 这 说 明 这 本 书 具 有 很 高 的 权威 性 。 我 们 有 幸 受 机 械 工 业 出 版 社 的 委托 ,翻译 龙 书 的 第 2 
版 。 

: 本 书 不 仅 包含 了 词法 分 析 、 语法 分 析 、 语 义 分 析 、 代 码 生成 等 传统 、 经 典 的 编译 知识 , 还 详 
细 介 绍 了 一 些 最 新 研究 成 果 ， 比 如 过 程 间 指 针 分 析 的 最 新 进展 。 这 使 得 本 书 不 仅 适用 于 编译 原 
理 的 初学 者 , 还 可 以 作为 研究 人 员 的 参考 书目 。 本 书 不 仅 介绍 编译 器 构造 的 基本 原理 和 技术 , 还 
详细 介绍 一 些 有 用 的 编译 器 构造 工具 ， 比 如 对 Lex 和 Yace 的 介绍 使 得 读者 可 以 了 解 这 些 工 具 的 
工作 原理 和 使 用 方法 。 除 此 之 外 , 读者 还 可 以 看 到 很 多 其 他 领域 的 概念 在 编译 器 构造 中 的 应 用 。 
比如 在 第 9 章 , 读者 可 以 看 到 群 论 中 的 抽象 概念 “ 格 ” 被 完美 地 应 用 于 数据 流 分 析 算 法 的 设计 。 
的 视野 和 思路 有 很 大 的 好 处 。 

由 于 本 书 覆 盖 的 范围 非常 广 , 不 可 能 在 一 个 学 期 内 讲 完 本 书 的 全 部 内 容 。 因 此 我 建议 采用 
本 书 作为 本 科 生 教材 的 老师 只 选择 讲授 其 中 的 基础 部 分 , BUSS 1 章 到 第 9 章 中 的 大 部 分 内 容 。 第 
2 章 是 对 后 面 各 章 内 容 的 介绍 , 可 以 在 讲授 相应 内 容 之 前 指导 学 生 预 习 。 

最 后 感谢 机 械 工 业 出 版 社 的 温 莉 芳 女 士 以 及 姚 葡 和 朱 动 两 位 编辑 在 本 书 的 翻译 过 程 中 给 予 
我 们 的 有 力 帮助 , 也 感谢 其 他 给 予 我 们 支持 的 同事 。 由 于 水 平 有 限 , 翻译 中 的 错漏 之 处 在 所 难 
P, 欢迎 读者 批评 指正 。 





译 者 
2008 年 6 月 于 南京 





从 本 书 的 1986 版 出 版 到 现在 , 编译 器 设计 领域 已 经 发 生 了 很 大 的 改变 。 随 着 程序 设计 语言 
的 发 展 , 提出 了 新 的 编译 问题 。 计 算 机 体系 结构 提供 了 多 种 多 样 的 资源 , 而 编译 器 设计 者 必须 能 
够 充分 利用 这 些 资 源 。 最 有 意思 的 事情 可 能 是 , 古老 的 代码 优化 技术 已 经 在 编译 器 之 外 找到 了 
新 的 应 用 。 现 在 , 有些 工具 利用 这 些 技术 来 寻找 软件 中 的 缺陷 , 以 及 (最 重要 的 是 ) 寻 找 现 有 代 
码 中 的 安全 漏洞 。 而 且 , 很 多 “前 端 "技术 一 一 文法 、 正 则 表达 式 、 语 法 分 析 器 以 及 语法 制导 翻译 
器 等 一 一 仍然 被 广泛 应 用 。 

因此 , 本 书 先前 的 版 本 所 体现 的 我 们 的 价值 观 一 直 没 有 改变 。 我 们 知道 ， 只 有 很 少 的 读者 将 
会 去 构建 甚至 维护 一 个 主流 程序 设计 语言 的 编译 器 。 但 是 ,和 编译 器 相关 的 模型 、 理 论 和 算法 可 
以 被 应 用 到 软件 设计 和 开发 中 出 现 的 各 种 各 样 的 问题 上 。 因 此 , 我 们 会 关注 那些 在 设计 一 个 语 
言 处 理 器 时 常常 会 磁 到 的 问题 , 而 不 考虑 具体 的 源 语言 和 目标 机 器 究 竞 是 什么 。 


使 用 本 书 


要 学 完 本 书 的 全 部 或 大 部 分 内 容 至 少 需要 两 个 学 季 ( quarter)， 甚 至 两 个 学 期 ( semester)9 。 
通常 会 在 一 门 本 科 课 程 中 讲授 本 书 的 前 半 部 分 内 容 ; 而 本 书 的 后 半 部 分 (强调 代码 优化 ) 会 在 研 
究 生 层面 或 另 一 门 小 范围 的 课程 中 讲授 。 下 面 是 各 章 的 概要 介绍 : 
e 第 1 章 给 出 一 些 关 于 学 习 动 机 的 资料 , 同时 也 将 给 出 一 些 关 于 计算 机 体系 结构 和 程序 设 
计 语 言 原则 的 背景 知识 。 

。 第 2 章 会 开发 一 个 小 型 的 编译 器 , 并 介绍 很 多 重要 概念 。 这 些 概念 将 在 后 面 的 各 章 中 深 
人 介绍 。 这 个 编译 器 本 身 将 在 附录 中 给 出 。 

o 第 3 章 将 讨论 词法 分 析 、 正 则 表达 式 、 有 人 穷 状 态 自 动机 和 词法 分 析 器 的 生成 器 工具 。 这 
些 内 容 是 各 种 文本 处 理 的 基础 。 

o 第 4 章 将 讨论 主流 的 语法 分 析 方 法 , 包括 自 项 向 下 方法 (递归 下 降 法 、LL 技术 ) 和 自 底 向 
上 方法 (LR 技术 和 它 的 变 体 ) 。 

。 第 5 章 将 介绍 语法 制导 定义 和 语法 制导 翻译 的 基本 思想 。 

第 6 章 将 使 用 第 5 章 中 的 理论 , 并 说 明 如 何 使 用 这 些 理论 为 一 个 典型 的 程序 设计 语言 生 
成 中 间 代 码 。 

o 第 7 章 将 讨论 运行 时 刻 环 境 , 特别 是 运行 时 刻 栈 的 管理 和 垃圾 回收 机 制 。 

第 8 章 将 主要 讨论 目标 代码 生成 技术 。 该 章 会 讨论 基本 块 的 构造 ， 从 表达 式 和 基本 块 生 
成 代码 的 方法 ， 以 及 寄存 器 分 配 技术 。 

© 第 9 章 将 介绍 代码 优化 技术 , 包括 流 图 、 数 据 流 分 析 框 架 以 及 求解 这 些 框 架 的 迭代 算法 。 
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O 美国 大 学 的 学 制 大 致 可 以 分 为 两 种 : quarter 学 季 ) 和 semester( 学 期 ) 。 前 者 是 把 一 年 分 为 4 个 quarter, 每 个 quar- 
ter3 个 月 , 原则 上 是 上 3 个 quarter 修一 个 quarter 的 假 ; 而 后 者 则 类 似 我 国 国内 的 寒暑 假 制 的 大 学 学 制 , 大 概 4 个 
编辑 注 





月 一 个 semester, 


VI 


。 第 10 章 将 讨论 指令 级 优化 。 该 章 的 重点 是 从 小 段 指令 代码 中 抽取 并 行 性 ,并 在 那些 可 以 

同时 做 多 件 事 情 的 单 处 理 器 上 调度 这 些 指令 。 

。 第 11 章 将 介绍 大 规模 并 行 性 的 检测 和 利用 。 这 里 的 重点 是 数值 计算 代码 。 这 些 代码 具有 

对 多 维 数组 进行 遍历 的 紧 致 循环 。 
e 第 12 章 将 介绍 过 程 间 分 析 技 术 。 它 将 讨论 指针 分 析 、 别 名 和 数据 流 分 析 。 这 些 分 析 都 考 
虑 了 到 达 代 码 中 某 个 给 定点 时 的 过 程 调用 序列 。 

本 伦比 亚 大 学 、 哈 佛 大 学 、 斯 坦 福 大 学 已 经 开设 了 讲授 本 书 内 容 的 课程 。 哥 伦比 亚 大 学 定期 
开设 一 门 关 于 程序 设计 语言 和 翻译 器 的 课程 , 使 用 了 本 书 前 8 章 的 内 容 。 该 课程 常年 面向 高 年 级 
本 科 生 /一 年 级 研究 生 讲授 , 这 门 课程 的 亮点 是 一 个 长 达 一 个 学 期 的 课程 实践 项 目 。 在 该 项 目 
中 , 学 生 分 成 小 组 , 创建 并 实现 一 个 他 们 自己 设计 的 小 型 语言 。 学 生 创 建 的 语言 涉及 多 个 应 用 领 
域 , 包括 量子 计算 、 音 乐 合 成 、 计算机 图 形 学 、 游 戏 、 和 矩阵 运算 和 很 多 其 他 领域 。 在 构建 他 们 自 
已 的 编译 器 时 , 学生 们 使 用 了 很 多 种 可 以 生成 编译 器 组 件 的 工具 ,比如 ANTLR, Lex 和 Yace; 他 
们 还 使 用 了 第 2 章 和 第 5 章 中 讨论 的 语法 制导 翻译 技术 。 后 续 的 研究 生 课程 的 重点 是 本 书 第 9 
章 到 第 12 章 的 内 容 , 着 重 强调 适用 于 当代 计算 机 (包括 网 络 处 理 器 和 多 处 理 器 体系 结构 ) 的 代码 
生成 和 优化 技术 。 : 

斯 坦 福 大 学 开设 了 一 门 历 时 一 个 学 季 的 人 门 课程 , 大 致 涵盖 了 本 书 第 1 章 到 第 8 章 的 内 容 ， 
同时 还 会 简介 本 书 第 9 章 中 全 局 代码 优化 的 相关 内 容 。 第 二 门 编译 器 课程 包括 本 书 第 9 章 到 第 
12 章 的 内 容 , 另外 还 包括 第 7 章 中 更 为 深入 的 有 关 垃 圾 收集 的 内 容 。 学 生 使 用 一 个 该 校 开发 的 、 
基于 Java 的 系统 Joeq 来 实现 数据 流 分 析 算 法 。 
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练习 
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第 1 章 sl Ê 


程序 设计 语言 是 向 人 以 及 计算 机 描述 计算 过 程 的 记号 。 如 我 们 所 知 ,， 这 个 世界 依赖 于 程序 
设计 语言 ,因为 在 所 有 计算 机 上 运行 的 所 有 软件 都 是 用 某 种 程序 设计 语言 编写 的 。 但 是 , 在 一 个 
程序 可 以 运行 之 前 ， 它 首先 需要 被 翻译 成 一 种 能 够 被 计算 机 执行 的 形式 。 

完成 这 项 PETERR RERA IF R (compiler) o 

本 书 介绍 的 是 设计 和 实现 编译 器 的 方法 。 我 们 将 介绍 用 于 构建 面向 多 种 语言 和 机 器 的 翻译 
器 的 一 些 基本 思想 。 编 译 器 设计 的 原理 和 技术 还 可 以 用 于 编译 器 设计 之 外 的 众多 领域 。 因 此 ， 
这 些 原理 和 技术 通常 会 在 一 个 计算 机 科学 家 的 职业 生涯 中 多 次 被 用 到 。 研 究 编译 器 的 编写 将 涉 
及 程序 设计 语言 、 计算 机 体系 结构 、 形 式 语言 理论 、 算 法 和 软件 工程 。 

在 本 章 中 ,我 们 将 介绍 语言 翻译 器 的 不 同形 式 ,在 高 层次 上 概述 一 个 典型 编译 器 的 结构 ， 
并 讨论 了 程序 设计 语言 和 硬件 体系 结构 的 发 展 趋势 。 这 些 趋势 将 影响 编译 器 的 形式 。 我 们 还 
将 介绍 关于 编译 器 设计 和 计算 机 科学 理论 的 关系 的 一 些 事实 , 并 给 出 编译 技术 在 编译 领域 之 
外 的 一 些 应 用 。 最 后 , 我 们 将 简单 论述 在 我 们 研究 编译 器 时 需要 用 到 的 重要 的 程序 设计 语言 


LAR o 
1.1 语言 处 理 器 
简单 地 说 , 一 个 编译 器 就 是 一 个 程序 , 它 可 以 阅读 以 某 一 种 语言 ( 源 语言 ) 编 写 的 程序 , 并 把 











该 程序 翻译 成 为 一 个 等 价 的 、 用 另 一 种 语言 ( 目标 语言 ) 编写 的 程序 , 参见 源 程序 
图 1-1。 编 译 器 的 重要 任务 之 一 是 报告 它 在 翻译 过 程 中 发 现 的 源 程序 中 的 

如 果 目 标 程序 是 一 个 可 执行 的 机 器 语言 程序 , 那么 它 就 可 以 被 用 户 调 TT 
用 , 处 理 输入 并 产生 输出 。 参 见 图 1-2。 Si 


解释 器 (interpreter) 是 另 一 种 常见 的 语言 处 理 器 。 它 并 不 通过 翻译 的 方 图 1-1 一 个 编译 器 
式 生成 目标 程序 。 从 用 户 的 角度 看 , 解释 器 直接 利用 用 户 提供 的 输入 执行 源 程序 中 指定 的 操作 。 
参见 图 13。 

在 把 用 户 输入 映射 成 为 输出 的 过 程 中 ,由 一 个 编译 器 产生 的 输入 一 =| anaes | 一 给 
机 器 语言 目标 程序 通常 比 一 个 解释 器 快 很 多 。 然 而 ,解释 器 的 错 
误诊 断 效果 通常 比 编译 器 更 好 ， 因 为 它 逐 个 语句 地 执行 源 程序 。 
Java 语言 处 理 器 结合 了 编译 和 解释 过 程 , 如 图 1-4 所 示 。 一 个 Java 源 程序 首先 被 编译 成 
一 个 称 为 字 节 码 (bytecode) 的 中 间 表 示 形 式 。 然 后 由 一 个 虚拟 机 对 得 到 的 字 节 码 加 以 解释 执行 。 这 
样 安排 的 好 处 之 一 是 在 一 台 机 器 上 编译 得 到 的 字 节 码 可 以 在 另 一 .jr 
全 机 器 上 解释 执行 。 通 过 网 络 就 可 以 完成 机 器 之 间 的 迁移 。 ~ 
”为 了 更 快 地 完成 输入 到 输出 的 处 理 , 有 些 被 称 为 即时 (just 
jh time) 编译 器 的 Java 编译 器 在 运行 中 间 程序 处 理 输入 的 前 一 图 13 一 个 解释 器 
刻 首先 把 字 节 码 翻 译 成 为 机 器 语言 ， 然后 再 执行 程序 。 口 
O WRIS 所 示 , 除了 编译 器 之 外 , 创建 一 个 可 执行 的 目标 程序 还 需要 一 些 其 他 程序 。 一 个 源 


图 12 运行 目标 程序 
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一 个 被 称 为 预 处 理 器 ( preprocessor) 的 程序 独立 完成 。 预 处 理 器 源 程序 
还 负责 把 那些 称 为 宏 的 缩写 形式 转换 为 源 语言 的 语句 。 
RE, 将 经 过 预 处 理 的 源 程序 作为 输入 传递 给 一 个 编译 器 。 | me 
编译 器 可 能 产生 一 个 汇编 语言 程序 作为 其 输出 ,因为 汇编 语言 
比较 容易 输出 和 调试 。 接 着 ， 这 个 汇编 语言 程序 由 称 为 汇编 器 PM enn i 
(assembler) 的 程序 进行 处 理 , 并 生成 可 重 定位 的 机 器 代码 。 aes 
大 型 程序 经 常 被 分 成 多 个 部 分 进行 编译 , 因此 , 可 重 定 图 1.4 一 个 混合 编译 器 
位 的 机 器 代码 有 必要 和 其 他 可 重 定位 的 目标 文件 以 及 库 文件 
连接 到 一 起 , 形成 真正 在 机 器 上 运行 的 代码 。 一 个 文件 中 的 源 程序 
代码 可 能 指向 另 一 个 文件 中 的 位 置 , 而 链接 器 (linker) 能 够 解 i 
次 外 部 内 存 地 址 的 问题 。 最 后 ， 加 载 器 (loader) 把 所 有 的 可 执 一 人 
行 目标 文件 放 到 内 存 中 执行 。 经 过 预 处 理 的 源 程序 
1. 1 节 的 练习 
练习 1. 1. 1: 编译 器 和 解释 器 之 间 的 区 别 是 什么 ? a 
练习 1. 1.2: 编译 器 相对 于 解释 器 的 优点 是 什么 ”解释 目标 汇编 程序 
器 相对 于 编译 器 的 优点 是 什么 ? | 
练习 1. 1. 3: 在 一 个 语言 处 理 系统 中 , 编译 器 产生 汇编 语 ”一 一 和 一 一 
言 而 不 是 机 器 语言 的 好 处 是 什么 ? 可 重 定位 机 器 代码 
练习 1. 1. 4: 把 一 种 高 级 语言 翻译 成 为 另 一 种 高 级 语言 ”一 + 一 











编译 器 


汇编 器 








i ; 链接 器 /加 载 器 | 一 库 文 人 
的 编译 器 称 为 源 到 源 (source-to-source) 的 翻译 器 。 编 译 器 使 | ss eee 
用 C 语言 作为 目标 语言 有 什么 好 处 ? ae 


练习 1. 1.5: 描述 一 下 汇编 器 所 要 完成 的 一 些 任务 。 图 1-5 一 个 语言 处 理 系统 
1.2 一 个 编译 器 的 结构 


到 现在 为 止 , 我 们 把 编译 器 看 作 一 个 黑 盒子 , 它 能 够 把 源 程序 映射 为 在 语义 上 等 价 的 目标 程 
序 。 如 果 把 这 个 盒子 稍微 打开 一 点 , 我 们 就 会 看 到 这 个 映射 过 程 由 两 个 部 分 组 成 : 分 析 部 分 和 综 
合 部 分 。 

分 析 (analysis) 部 分 把 源 程序 分 解 成 为 多 个 组 成 要 素 , 并 在 这 些 要 素 之 上 加 上 语法 结构 。 然 
E, 它 使 用 这 个 结构 来 创建 该 源 程序 的 一 个 中 间 表 示 。 如 果 分 析 部 分 检查 出 源 程序 没有 按照 正 
确 的 语法 构成 , 或 者 语义 上 不 一 致 , 它 就 必须 提供 有 用 的 信息 , 使 得 用 户 可 以 按 此 进行 改正 。 分 
析 部 分 还 会 收集 有 关 源 程序 的 信息 ,并 把 信息 存放 在 一 个 称 为 符号 表 (symbol table) 的 数据 结构 
中 。 符 号 表 将 和 中 间 表 示 形 式 一 起 传送 给 综合 部 分 。 

综合 (synthesis ) 部 分 根据 中 间 表 示 和 符号 表 中 的 信息 来 构造 用 户 期 待 的 目标 程序 。 分 析 部 分 
经 常 被 称 为 编译 器 的 前 端 (front end) 而 综合 部 分 称 为 后 端 (back end) 。 

如 果 我 们 更 加 详细 地 研究 编译 过 程 , 会 发 现 它 顺 序 执行 了 一 组 步骤 (phase) 。 每 个 步骤 把 源 
程序 的 一 种 表示 方式 转换 成 另 一 种 表示 方式 。 一 个 典型 的 把 编译 程序 分 解 成 为 多 个 步骤 的 方式 
如 图 1-6 所 示 。 在 实践 中 , 多 个 步骤 可 能 被 组 合 在 一 起 ,而 这 些 组 合 在 一 起 的 步骤 之 间 的 中 间 表 
示 不 需要 被 明确 地 构造 出 来 。 存 放 整 个 源 程序 的 信息 的 符号 表 可 由 编译 器 的 各 个 步骤 使 用 。 

有 些 编译 器 在 前 端 和 后 端 之 间 有 一 个 与 机 器 无 关 的 优化 步骤 。 这 个 优化 步 又 的 目的 是 在 中 
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间 表 示 之 上 进行 转换 ,以 便 后 端 程序 能 够 生成 更 好 的 目标 程序 。 如 果 基 于 未 经 过 此 优化 步骤 的 


中 间 表 示 来 生成 代码 , 则 代码 的 质量 会 受到 影响 。 
因为 优化 是 可 选 的 , 所 以 图 1-6 中 所 示 的 两 个 优化 
步骤 之 一 可 以 被 省 略 。 
1.2.1 词法 分 析 

编译 器 的 第 一 个 步骤 称 为 词法 分 析 (]lexical 
analysis) 或 扫描 (scanning)。 词 法 分 析 器 读 人 组 成 
源 程序 的 字符 流 , 并 且 将 它们 组 织 成 为 有 意义 的 词 
素 (lexeme) 的 序列 。 对 于 每 个 词素 ,词法 分 析 器 产 
生 如 下 形式 的 词法 单元 (token) 作为 输出 : 

《token-name attribute-value) 

这 个 词法 单元 被 传送 给 下 一 个 步骤 ， 即 语法 分 
析 。 在 这 个 词法 单元 中 , 第 一 个 分 量 token-name 是 
一 个 由 语法 分 析 步 又 使 用 的 抽象 符号 , 而 第 二 个 分 
量 attribute-value 指向 符号 表 中 关于 这 个 词法 单元 
的 条 目 。 符 号 表 条 目的 信息 会 被 语义 分 析 和 代码 生 
成 步骤 使 用 。 

比如 , 假设 一 个 源 程序 包含 如 下 的 赋值 语句 

position = initial + rate * 60 (1.1) 

这 个 赋值 语句 中 的 字符 可 以 组 合成 如 下 词素 ， 
并 映射 成 为 如 下 词法 单元 。 这 些 词法 单元 将 被 传递 
给 语法 分 析 阶 段 。 








1) position 是 一 个 词素 , 被 映射 成 词法 单元 (id, 1), 其 中 id 是 表示 标识 符 (identifier ) 的 
抽象 符号 , 而 1 指向 符号 表 中 position 对 应 的 条 目 。 一 个 标识 符 对 应 的 符号 表 条 目 存 放 该 标 


识 符 有 关 的 信息 ， 比 如 它 的 名 字 和 类 型 。 


2) 赋值 符号 = 是 一 个 词素 , 被 映射 成 词法 单元 ( = )。 因 为 这 个 词法 单元 不 需要 属性 值 , 所 
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图 1-6 一 个 编译 器 的 各 个 步 又 





以 我 们 省 略 了 第 二 个 分 量 。 也 可 以 使 用 assign 这 样 的 抽象 符号 作为 词法 单元 的 名 字 , 但 是 为 了 
标记 上 的 方便 , 我 们 选择 使 用 词素 本 身 作 为 抽象 符号 的 名 字 。 


3) initial 是 一 个 词素 , 被 映射 成 词法 单元 (id, 2), 其 中 2 指向 initial 对 应 的 符号 表 


条 目 。 
4) + 是 一 个 词素 , 被 映射 成 词法 单元 ( + )。 


5) rate 是 一 个 词素 , 被 映射 成 词法 单元 (id, 3), 其 中 3 指向 rate 对 应 的 符号 表 条 目 。 


6) * 是 一 个 词素 , 被 映射 成 词法 单元 ( * ) 。 
7) 60 是 一 个 词素 , 被 映射 成 词法 单元 (6079 。 
分 隔 词素 的 空格 会 被 词法 分 析 器 忽略 掉 。 





图 177 给 出 经 过 词法 分 析 之 后 , 赋值 语句 1. 1 被 表示 成 如 下 的 词法 单元 序列 ， 


(id, 1) (=) Cid, 2) (+) Cid, 3) <») (60) 


(1.2) 





在 这 个 表示 中 , 词法 单元 名 = 、+ 和 * 分 别 是 表示 赋值 、 加 法 运算 符 、 乘 法 运算 符 的 抽象 符号 。 


O 从 技术 上 讲 ,我 们 应 该 为 语法 单元 60 建立 一 个 形 如 《number, 4) 的 词法 单元 , 其 中 4 指向 符号 表 中 对 应 于 整数 60 
的 条 目 。 但 是 我 们 要 到 第 2 章 中 才 讨论 数字 的 词法 单元 。 第 3 章 将 讨论 建立 词法 分 析 器 的 技术 。 
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中 间 代码 生成 器 





tl = inttofloat(60) 
t2 = id3 * tl 

t3 = id2 + t2 

idl = t3 


代码 优化 器 


tl = id3 * 60.0 
id1 = id2 + t1 


代码 生成 器 


LDF R2, id3 

MULF R2, R2, #60.0 
LDF R1, id2 

ADDF R1, R1, R2 
STF idl, R1 





图 1-7 一 个 赋值 语句 的 翻译 


1. 2.2 语法 分 析 

编译 器 的 第 2 个 步骤 称 为 语法 分 析 (syntax analysis ) 或 解析 ( parsing) 。 语 法 分 析 器 使 用 由 词 
法 分 析 器 生成 的 各 个 词法 单元 的 第 一 个 分 量 来 创建 树 形 的 中 间 表 示 。 该 中 间 表 示 给 出 了 词法 分 
析 产 生 的 词法 单元 流 的 语法 结构 。 一 个 常用 的 表示 方法 是 语法 树 (syntax tree), 树 中 的 每 个 内 部 
结 点 表示 一 个 运算 , 而 该 结 点 的 子 结 点 表示 该 运算 的 分 量 。 在 图 1-7 中 , 词法 单元 流 (1.2) 对 应 
的 语法 树 被 显示 为 语法 分 析 器 的 输出 。 

这 棵 树 显示 了 赋值 语句 

position = initial + rate * 60 
中 各 个 运算 的 执行 顺序 。 这 棵 树 有 一 个 标号 为 * 的 内 部 结 点 ，<ia, 3 > 是 它 的 左 子 结 点 , 整数 60 
是 它 的 右 子 结 点 。 结 点 <ia, 3 > 表示 标识 符 rate。 标 号 为 * 的 结 点 指明 了 我 们 必须 首先 把 rate 
的 值 与 60 相 乘 。 标 号 为 + 的 结 点 表明 我 们 必须 把 相 乘 的 结果 和 initial 的 值 相 加 。 这 棵 树 的 根 
结 点 的 标号 为 =, 它 表 明 我 们 必须 把 相 加 的 结果 存储 到 标识 符 position 对 应 的 位 置 上 去 。 这 个 运 
算 顺 序 和 通常 的 算术 规则 相同 ， 即 乘法 的 优先 级 高 于 加 法 ,因此 乘法 应 该 在 加 法 之 前 计算 。 

编译 器 的 后 续 步 骤 使 用 这 个 语法 结构 来 帮助 分 析 源 程序 , 并 生成 目标 程序 。 在 第 4 章 , 我 们 
将 使 用 上 下 文 无 关 文 法 来 描述 程序 设计 语言 的 语法 结构 ， 并 讨论 为 某 些 类 型 的 语法 自动 构造 高 
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效 语法 分 析 器 的 算法 。 在 第 2 章 和 第 5 章 , 我 们 将 看 到 , 语法 制导 的 定义 将 有 助 于 描述 对 程序 设 
计 语 言 结 构 的 翻译 。 
1.2.3 语义 分 析 

语义 分 析 器 (semantic analyzer) 使 用 语法 树 和 符号 表 中 的 信息 来 检查 源 程序 是 否 和 语言 定义 
的 语义 一 致 。 它 同时 也 收集 类 型 信息 , 并 把 这 些 信息 存放 在 语法 树 或 符号 表 中 ， 以便 在 随后 的 中 
间 代 码 生 成 过 程 中 使 用 。 

语义 分 析 的 一 个 重要 部 分 是 类 型 检查 (type checking) 。 编 译 器 检查 每 个 运算 符 是 否 具 有 匹配 
的 运算 分 量 。 比 如 , 很 多 程序 设计 语言 的 定义 中 要 求 一 个 数组 的 下 标 必须 是 整数 。 如 果 用 一 个 
淫 点 数 作为 数组 下 标 , 编译 器 就 必须 报告 错误 。 | 

程序 设计 语言 可 能 允许 某 些 类 型 转换 ， 这 被 称 为 自动 类 型 转换 (coercion ) 。 比 如 ， 一 个 二 元 
算术 运算 符 可 以 应 用 于 一 对 整数 或 者 一 对 浮 点 数 。 如 果 这 个 运算 符 应 用 于 一 个 浮 点 数 和 一 个 整 
数 , 那么 编译 器 可 以 把 该 整数 转换 (或 者 说 自动 类 型 转换 ) 成 为 一 个 浮 点 数 。 

图 1-7 中 显示 了 一 个 这 样 的 自动 类 型 转换 。 假 设 position, initial 和 rate 已 被 声明 为 浮 
点 数 类 型 , 而 词素 60 本 身 形成 一 个 整数 。 图 1-7 中 的 语义 分 析 器 的 类 型 检查 程序 发 现 运算 符 * 被 用 
于 一 个 浮 点 数 rate 和 一 个 整数 60。 在 这 种 情况 下 ,这 个 整数 可 以 被 转换 成 为 一 个 浮 点 数 。 请 注 
意 , 在 图 1-7 中 , 语义 分 析 器 输出 中 有 一 个 关于 运算 符 inttofloat 的 额外 结 点 。inttofloat 明确 地 把 它 
的 整数 参数 转换 为 一 个 浮 点 数 。 类 型 检查 和 语义 分 析 将 在 第 6 章 中 讨论 。 

1.2.4 中 和 间 代 码 生 成 

在 把 一 个 源 程序 翻译 成 目标 代码 的 过 程 中 , 一 个 编译 器 可 能 构造 出 一 个 或 多 个 中 间 表 示 。 
这 些 中 间 表 示 可 以 有 多 种 形式 。 语 法 树 是 一 种 中 间 表 示 形 式 , 它们 通常 在 语法 分 析 和 语义 分 析 
中 使 用 。 

在 源 程序 的 语法 分 析 和 语义 分 析 完 成 之 后 , 很 多 编译 器 生成 一 个 明确 的 低级 的 或 类 机 器 语 
言 的 中 间 表 示 。 我 们 可 以 把 这 个 表示 看 作 是 某 个 抽象 机 器 的 程序 。 该 中 间 表 示 应 该 具有 两 个 重 
要 的 性 质 : 它 应 该 易于 生成 , 且 能 够 被 轻松 地 翻译 为 目标 机 器 上 的 语言 。 

在 第 6 章 , 我 们 将 考虑 一 种 称 为 三 地 址 代码 (three-address code) 的 中 间 表 示 形 式 。 这 种 中 间 
表示 由 一 组 类 似 于 汇编 语言 的 指令 组 成 , 每 个 指令 具有 三 个 运算 分 量 。 每 个 运算 分 量 都 像 一 个 
寄存 器 。 图 1-7 中 的 中 间 代 码 生成 器 的 输出 是 如 下 的 三 地 址 代码 序列 : 

tt = inttofloat(60) 
t2 = id3 * ti 


t3 = id2+ t2 (1.3) 
idi = t3 


关于 三 地 址 指令 , 有 几 点 是 值得 专门 指出 的 。 首 先 , 每 个 三 地 址 赋值 指令 的 右 部 最 多 只 有 一 
个 运算 符 。 因 此 这 些 指令 确定 了 运算 完成 的 顺序 。 在 源 程序 1. 1 中 , 乘法 应 该 在 加 法 之 前 完成 。 
第 二 , 编译 器 应 该 生成 一 个 临时 名 字 以 存放 一 个 三 地 址 指令 计算 得 到 的 值 。 第 三 , 有 些 三 地 址 指 
令 的 运算 分 量 的 少 于 三 个 (比如 上 面 的 序列 1. 3 中 的 第 一 个 和 最 后 一 个 指令 ) 。 

在 第 6 章 , 我 们 将 讨论 在 不 同 编译 器 中 用 到 的 主要 中 间 表 示 形 式 。 第 5 章 将 介绍 语法 制导 翻 
译 技术 。 这 些 技术 在 第 6 章 中 被 用 于 处 理 典型 程序 设计 语言 构造 进行 类 型 检查 和 中 间 代 码 生 成 。 
这 些 程序 设计 语言 构造 包括 : 表达 式 、 控制 流 构造 和 过 程 调用 。 
1.2.5 代码 优化 . 

机 器 无 关 的 代码 优化 步骤 试图 改进 中 间 代 码 , 以 便 生 成 更 好 的 目标 代码 。“ 更 好 "通常 意味 着 
更 快 , 但 是 也 可 能 会 有 其 他 目标 , 如 更 短 的 或 能 耗 更 低 的 目标 代码 。 比 如 , 一 个 简单 直接 的 算法 会 
生成 中 间 代 码 (1.3)。 它 为 由 语义 分 析 器 得 到 的 树 形 中 间 表 示 中 的 每 个 运算 符 都 使 用 一 个 指令 。 














使 用 一 个 简单 的 中 间 代 码 生 成 算法 , 然后 再 进行 代码 优化 步 又 是 生成 优质 目标 代码 的 一 个 
合理 方法 。 优 化 器 可 以 得 出 结论 : 把 60 从 整数 转换 为 浮 点 数 的 运算 可 以 在 编译 时 刻 一 劳 永 逸 地 
完成 。 因 此 , 用 浮 点 数 60. 0 HEE CHES 60 就 可 以 消除 相应 的 inttofloat zB, MA, t3 仅 被 使 
用 一 次 , 用 来 把 它 的 值 传递 给 idl, AU, 优化 器 可 以 把 序列 (1.3) 转 换 为 更 短 的 指令 序列 


tl = id3 * 60.0 
idl = id2 + t1 (1:4) 


不 同 的 编译 器 所 做 的 代码 优化 工作 量 相差 很 大 。 那 些 优化 工作 做 得 最 多 的 编译 器 , 即 所 谓 的 
“优化 编译 器 ”, 会 在 优化 阶段 花 相 当 多 的 时 间 。 有 些 简单 的 优化 方法 可 以 极 大 地 提高 目标 程序 的 运 
行 效率 而 不 会 过 多 降低 编译 的 速度 。 从 第 8 章 开始 , 将 详细 讨论 机 器 无 关 和 机 器 相关 的 优化 。 
1.2.6 代码 生成 

代码 生成 器 以 源 程 序 的 中 间 表 示 形 式 作为 输入 , 并 把 它 映 射 到 目标 语言 。 如 果 目 标语 言 是 
机 器 代码 , 那么 就 必须 为 程序 使 用 的 每 个 变量 选择 寄存 器 或 内 存 位 置 。 然 后 ， 中 间 指 令 被 翻译 成 
为 能 够 完成 相同 任务 的 机 器 指令 序列 。 代 码 生成 的 一 个 至 关 重 要 的 方面 是 合理 分 配 寄存 器 以 存 
放 变 量 的 值 。 

比如 , 使 用 寄存 器 RI 和 R2 ，(1.4) 中 的 中 间 代 码 可 以 被 翻译 成 为 如 下 的 机 器 代码 : 

有 
LDF R1, id2 (1.5) 


ADDF R1, R1, R2 
STF idi, R1 


每 个 指令 的 第 一 个 运算 分 量 指定 了 一 个 目标 地 址 。 各 个 指令 中 的 F 告诉 我 们 它 处 理 的 是 浮 
点 数 。 代 码 (1.5) 把 地 址 id3 中 的 内 容 加 载 到 寄存 器 R2 F, 然后 将 其 与 浮 点 常数 60.0 AR. 
号 “#” 表 示 60.0 应 该 作为 一 个 立即 数 处 理 。 第 三 个 指令 把 id2 移动 到 寄存 器 R1 中 , 而 第 四 个 指 
令 把 前 面 计 算得 到 并 存放 在 R2 中 的 值 加 到 R 上 。 最 后 , 在 寄存 器 R1 中 的 值 被 存放 到 idl 的 地 
址 中 去 。 这 样 , 这 些 代码 正确 地 实现 了 赋值 语句 (1.1)。 第 8 章 将 讨论 代码 生成 。 

上 面 对 代 码 生 成 的 讨论 忽略 了 对 源 程 序 中 的 标识 符 进行 存储 分 配 的 重要 问题 。 我 们 将 在 第 7 
章 中 看 到 , 运行 时 刻 的 存储 组 织 方法 依赖 于 被 编译 的 语言 。 编 译 器 在 中 间 代 码 生 成 或 代码 生成 
阶段 做 出 有 关 存 储 分 配 的 决定 。 

1.2.7 符号 表 管 理 

编译 器 的 重要 功能 之 一 是 记录 源 程 序 中 使 用 的 变量 的 名 字 , 并 收集 和 每 个 名 字 的 各 种 属性 
有 关 的 信息 。 这 些 属性 可 以 提供 一 个 名 字 的 存储 分 配 、 它 的 类 型 、 作 用 域 ( 即 在 程序 的 哪些 地 方 
可 以 使 用 这 个 名 字 的 值 ) 等 信息 。 对 于 过 程 名 字 , 这 些 信息 还 包括 : 它 的 参数 数量 和 类 型 、 每 个 
参数 的 传递 方法 (比如 传 值 或 传 引 用 ) 以 及 返回 类 型 。 

符号 表 数 据 结构 为 每 个 变量 名 字 创 建 了 一 个 记录 条 目 。 记 录 的 字段 就 是 名 字 的 各 个 属性 。 
这 个 数据 结构 应 该 允许 编译 器 迅速 查找 到 每 个 名 字 的 记录 , 并 向 记录 中 快速 存放 和 获取 记录 中 
的 数据 。 符 号 表 在 第 2 章 中 讨论 。 

1.2.8 将 多 个 步骤 组 合成 越 

前 面 关于 步骤 的 讨论 讲 的 是 一 个 编译 器 的 逻辑 组 织 方式 。 在 一 个 特定 的 实现 中 , 多 个 步 又 
的 活动 可 以 被 组 合成 一 赵 (pass) 。 每 趟 读 和 人 一 个 输入 文件 并 产生 一 个 输出 文件 。 比 如 ,前端 步 又 
中 的 词法 分 析 、 语法 分 析 、 语义 分 析 , 以 及 中 间 代 码 生 成 可 以 被 组 合 在 一 起 成 为 一 趟 。 代 码 优 化 
可 以 作为 一 个 可 选 的 趟 。 然 后 可 以 有 一 个 为 特定 目标 机 生成 代码 的 后 端 趟 。 

有 些 编译 器 集合 是 围绕 一 组 精心 设计 的 中 间 表 示 形 式 而 创建 的 , 这 些 中 间 表 示 形 式 使 得 我 
们 可 以 把 特定 语言 的 前 端 和 特定 目标 机 的 后 端 相 结合 。 使 用 这 些 集合 , 我 们 可 以 把 不 同 的 前 端 


5] 论 7 





和 某 个 且 标 机 的 后 端 结合 起 来 ,为 不 同 的 源 语 言 建立 该 目标 机 上 的 编译 器 。 类 似 地 , 我 们 可 以 把 
一 个 前 端 和 和 不同 的 月 标 机 后 端 结合 ,建立 针对 不 同 目 标 机 的 编译 器 。 
1.2.9 编译 器 构造 工具 

和 任何 软件 开发 者 一 样 ， 写 编译 器 的 人 可 以 充分 利用 现代 的 软件 开发 环境 。 这 些 环境 中 包 
含 了 诸如 语言 编辑 器 、 调 试 器 、 版 本 管理 、 程 序 描述 器 、 测 试管 理 等 工具 。 除 了 这 些 通用 的 软件 
开发 工具 , 人 们 还 创建 了 一 些 更 加 专业 的 工具 来 实现 编译 器 的 不 同 阶段 。 

这 些 工具 使 用 专用 的 语言 来 描述 和 实现 特定 的 组 件 , 其 中 的 很 多 工具 使 用 了 相当 复杂 的 算 
法 。 其 中 最 成 功 的 工具 都 能 够 隐藏 生成 算法 的 细节 , 并 且 它 们 生成 的 组 件 易 于 和 编译 器 的 其 他 
部 分 相 集 成 。 一 些 常用 的 编译 器 构造 工具 包括 : 

1) 语法 分 析 器 的 生成 器 : 可 以 根据 一 个 程序 设计 语言 的 语法 描述 自动 生成 语法 分 析 器 。 

2) 扫描 器 的 生成 器 : 可 以 根据 一 个 语言 的 语法 单元 的 正则 表达 式 描述 生成 词法 分 析 器 。 

3) 语法 制导 的 翻译 引擎 : 可 以 生成 一 组 用 于 遍历 分 析 树 并 生成 中 间 代 码 的 例 程 。 

4) 代码 生成 器 的 生成 器 : 依据 一 组 关于 如 何 把 中 间 语 言 的 每 个 运算 翻译 成 为 目标 机 上 的 机 
器 语言 的 规则 , 生成 一 个 代码 生成 器 。 

5) 数据 流 分 析 引 擎 : 可 以 帮助 收集 数据 流 信息 ， 即 程序 中 的 值 如 何 从 程序 的 一 个 部 分 传递 
到 另 一 部 分 。 数 据 流 分 析 是 代码 优化 的 一 个 重要 部 分 。 

6) 编译 器 构造 工具 集 : 提供 了 可 用 于 构造 编译 器 的 不 同 阶段 的 例 程 的 完整 集合 。 

ERPF, 我 们 将 讨论 多 个 这 类 工具 的 例子 。 


1.3 程序 设计 语言 的 发 展 历程 


第 一 台电 子 计算 机 出 现在 20 世纪 40 年 代 。 它 使 用 由 0、! 序列 组 成 的 机 器 语言 编程 ,这 个 
序列 明确 地 告诉 计算 机 以 什么 样 的 顺序 执行 哪些 运算 。 运 算 本 身 也 是 很 低层 的 : 把 数据 从 一 个 
位 置 移动 到 另 一 个 位 置 , 把 两 个 寄存 器 中 的 值 相 加 ,比较 两 个 值 , 等 等 。 不 用 说 , 这 种 编程 速度 
慢 且 枯燥 , 而 且 容 易 出 错 。 写 出 的 程序 也 是 难以 理解 和 修改 的 。 

1.3.1 走向 高 级 程序 设计 语言 

走向 更 加 人 类 友好 的 程序 设计 语言 的 第 一 步 是 20 世纪 50 年 代 早期 人 们 对 助 记 汇编 语言 
开发 。 一 开始 , 一 个 汇编 语言 中 的 指令 仅仅 是 机 器 指令 的 助 记 表 示 。 后 来 , 宏 指 令 被 加 入 到 汇编 
语言 中 。 这 样 , 程序 员 就 可 以 通过 宏 指 令 为 频繁 使 用 的 机 器 指令 序列 定义 带 有 参数 的 缩写 。 

走向 高 级 程序 设计 语言 的 重大 一 步 发 生 在 20 世纪 50 年 代 的 后 五 年 。 其 间 , 用 于 科学 计算 的 
Fortran 语言 , 用 于 商业 数据 处 理 的 Cobo 语言 和 用 于 符号 计算 的 Lisp 语言 被 开发 出 来 。 在 这 些 语 
言 的 基本 原理 是 设计 高 层次 表示 方法 ， 使 得 程序 员 可 以 更 加 容易 地 写 出 数值 计算 、 商 业 应 用 和 符 
号 处 理 程序 。 这 些 语言 取得 了 很 大 的 成 功 , 至 今 仍然 有 人 使 用 它们 。 

在 接 下 来 的 几 十 年 里 , 很 多 带 有 新 特性 的 程序 设计 语言 被 陆续 开发 出 来 。 它 们 使 得 编程 更 
加 容易 、 自 然 , 功能 也 更 强大 。 我 们 将 在 本 章 的 后 面部 分 讨论 很 多 现代 程序 设计 语言 所 共有 的 一 
些 关键 特征 。 

当前 有 几 千 种 程序 设计 语言 。 可 以 通过 不 同 的 方式 对 这 些 语 言 进行 分 类 。 方 式 之 一 是 通过 
语言 的 代 来 分 类 。 第 一 代 语 言 是 机 器 语言 ， 第 二 代 语 言 是 汇编 语言 ， 而 第 三 代 语 言 是 Fortran、 
Cobol、Lisp、C、C ++ 、C# 及 Java 这 样 的 高 级 程序 设计 语言 。 第 四 代 语 言 是 为 特定 应 用 设计 的 语 
言 ， 比 如 用 于 生成 报告 的 NOMAD, 用 于 数据 库 查 询 的 SQL 和 用 于 文本 排版 的 Postscript。 术 语 第 
五 代 语 言 指 的 是 基于 逻辑 和 约束 的 语言 ， 比 如 Prolog 和 OPS5。 








另 一 种 语言 分 类 方式 把 程序 中 指明 如 何 完 成 一 个 计算 任务 的 语言 的 称 为 强制 式 (imperative ) 请 
言 ,而 把 程序 中 指明 要 进行 哪些 计算 的 语言 称 为 声明 式 (declarative) 语 言 。 诸 如 C、C ++ 、C# 和 0 Java 
等 语言 都 是 强制 式 语言 。 所 有 强制 式 语言 中 都 有 用 于 表示 程序 状态 和 语句 的 表示 方法 , 这 些 语句 可 
以 改变 程序 状态 。 像 ML, Haskell 这 样 的 函数 式 语 言 和 Prolog 这 样 的 约束 逻辑 语言 通常 被 认为 是 声 
明 式 语言 。 

术语 冯 “， 诺 伊 曼 语言 (von Neumann language) 是 指 以 冯 ， 庄 伊 曼 计算 机 体系 结构 为 计算 模型 
的 程序 设计 语言 。 今 天 的 很 多 语言 (比如 Fortran 和 C0) 都 是 冯 : 诺 伊 曼 语 言 。 

面向 对 象 语言 (object-oriented language) 指 的 是 支持 面向 对 象 编程 的 语言 ,面向 对 象 编程 是 指 
用 一 组 相互 作用 的 对 象 组 成 程序 的 编程 风格 。Simula 67 和 Smalltalk 是 早期 的 主流 面向 对 象 语言 。 
C++、Cf#、Java 和 Ruby 是 现在 常用 的 面向 对 象 语言 。 

脚本 语言 (scripting language) 是 具有 高 层次 运算 符 的 解释 型 语言 , 它 通常 被 用 于 把 多 个 计算 过 
程 “ 粘 合 "在 一 起 。 这 些 计算 过 程 被 称 为 脚本 。Awk JavaScript, Perl, PHP. Python, Ruby 和 Tcl 是 常 
见 的 脚本 语言 。 使 用 脚本 语言 编写 的 程序 通常 要 比 用 其 他 语言 (比如 C) 写 的 等 价 的 程序 短 很 多 。 
1.3.2 对 编译 器 的 影响 

因为 程序 设计 语言 的 设计 和 编译 器 是 紧密 相关 的 ,程序 设计 语言 的 发 展 向 编译 器 的 设计 者 
提出 了 新 的 要 求 。 他 们 必须 设计 相应 的 算法 和 表示 方式 来 翻译 和 支持 新 的 语言 特征 。 从 20 世纪 
40 年 代 以 来 , 计算 机 体系 结构 也 有 了 很 大 的 发 展 。 编 译 器 的 设计 者 不 仅 需 要 跟踪 新 的 语言 特征 ， 
还 需要 设计 出 新 的 翻译 算法 ,以 便 尽 可 能 地 利用 新 硬件 的 能 力 。 

通过 降低 用 高 级 语言 程序 的 执行 开销 , 编译 器 还 可 以 推动 这 些 高 级 语言 的 使 用 。 要 使 得 高 性 能 计 
算 机 体系 结构 能 够 高 效 运行 用 户 应 用 , 编译 器 也 是 至 关 重要 的 。 实 际 上 , 计算 机 系统 的 性 能 是 非常 依 
赖 于 编译 技术 的 ， 以 至 于 在 构建 一 个 计算 机 之 前 , 编译 器 会 被 用 作 评 价 一 个 体系 结构 概念 的 工具 。 

编写 编译 器 是 很 有 挑战 性 的 。 编 译 器 本 身 就 是 一 个 大 程序 。 而 且 , 很 多 现代 语言 处 理 系统 在 同 
一 个 框架 内 处 理 多 种 源 语言 和 上 且 标 机 。 也 就 是 说 , 这 些 系统 可 以 被 当做 一 组 编译 器 来 使 用 , 可 能 包 
含 几 百 万 行 代码 。 因 此 , 好 的 软件 工程 技术 对 于 创建 和 发 展现 代 的 语言 处 理 器 是 非常 重要 的 。 

编译 器 必须 能 够 正确 翻译 用 源 语 言 书写 的 所 有 程序 。 这 样 的 程序 的 集合 通常 是 无 穷 的 。 为 
一 个 源 程 序 生成 最 佳 目 标 代码 的 问题 一 般 来 说 是 不 可 判定 的 。 因 此 , 编译 器 的 设计 者 必须 作出 
折衷 处 理 , 确定 解 决 哪些 问题 , 使 用 哪些 启发 式 信息 ,以便 解决 高 效 代 码 生成 的 问题 。 

我 们 将 在 1.4 BE, 有 关 编 译 器 的 研究 也 是 有 关 如 何 使 用 理论 来 解决 实践 问题 的 研究 。 

本 书 的 目的 是 教授 编译 器 设计 中 使 用 的 根本 思想 和 方法 论 。 本 书 并 不 想 让 读者 学 习 建 立 一 
个 最 新 的 语言 处 理 系 统 时 可 能 用 到 的 所 有 算法 和 技术 。 但 是 , 本 书 的 读者 将 获得 必要 的 基础 知 
识 和 理解 ,学 会 建立 一 个 相对 简单 的 编译 器 。 
1.33 1.3 节 的 练习 

练习 1. 3. 1: 指出 下 面 的 术语 : 

1) 强制 式 的 2) 声明 式 的 3) 冯 : 诺 伊 曼 式 的 4) 面向 对 象 的 








5) 函数 式 的 6) 第 三 代 7) 第 四 代 8) 脚本 语言 
可 以 被 用 于 描述 下 面 的 哪些 语言 : 

1)C 2) C++ 3) Cobol 4) Fortran 5) Java 
6) Lisp 7) ML 8) Perl 9) Python 10) VB 


1.4 ”构建 一 个 编译 器 的 相关 科学 
编译 器 的 设计 中 有 很 多 通过 数学 方法 抽象 出 问题 本 质 从 而 解决 现实 世界 中 复杂 问题 的 完美 
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例子 。 这 些 例子 可 以 被 用 来 说 明 如 何 使 用 抽象 方法 来 解决 问题 ; 接受 一 个 问题 , 写 出 抓 住 了 问题 
的 关键 特性 的 数学 抽象 表示 , 并 用 数学 技术 来 解决 它 。 问 题 的 表达 必须 根植 于 对 计算 机 程序 特 
性 的 深入 理解 ,而 解决 方法 必须 使 用 经 验 来 验证 和 精 化 。 

编译 器 必须 接受 所 有 遵循 语言 规范 的 源 程 序 。 源 程序 的 集合 是 无 穷 的 ， 而 程序 可 能 大 到 包 
含 几 百 万 行 代码 。 在 翻译 一 个 源 程序 的 过 程 中 , 编译 器 所 做 的 任何 翻译 工作 都 不 能 改变 被 编译 
源 程 序 的 含义 。 因 此 , 编译 器 设计 者 的 工作 不 仅 会 影响 到 他 们 创建 的 编译 器 , 还 会 影响 到 他 们 所 
创建 的 编译 器 所 编译 的 全 部 程序 。 这 种 杠杆 作用 使 得 编译 器 设计 的 回报 丰厚 , 但 也 使 得 编译 器 
的 开发 工作 具有 挑战 性 。 

1.4.1 编译 器 设计 和 实现 中 的 建 模 

对 编译 器 的 研究 主要 是 有 关 如 何 设计 正确 的 数学 模型 和 选择 正确 算法 的 研究 。 设 计 和 选择 
时 , 还 需要 考虑 到 对 通用 性 及 功能 的 要 求 与 简单 性 及 有 效 性 之 间 的 平衡 。 

最 基本 的 数学 模型 是 我 们 将 在 第 3 章 介 绍 的 有 穷 状 态 自动 机 和 正则 表达 式 。 这 些 模型 可 以 
用 于 描述 程序 的 词法 单位 (关键 字 、 标 识 符 等 ) 以 及 描述 被 编译 器 用 来 识别 这 些 单位 的 算法 。 最 
基本 的 模型 中 还 包括 上 下 文 无 关 文 法 , 它 用 于 描述 程序 设计 语言 的 语法 结构 ， 比 如 柑 春 的 括号 和 
控制 结构 。 我 们 将 在 第 4 章 研究 文法 。 类 似 地 , 树 形 结构 是 表示 程序 结构 以 及 程序 到 目标 代码 的 
翻译 方法 的 重要 模型 。 我 们 将 在 第 5 章 介绍 这 一 概念 。 

1.4.2 代码 优化 的 科学 

在 编译 器 设计 中 , 术语 “优化 ”是 指 编译 器 为 了 生成 比 浅显 直观 的 代码 更 加 高 效 的 代码 而 做 
的 工作 。“ 优 化 "这 个 词 并 不 恰当 , 因为 没有 办 法 保证 一 个 编译 器 生成 的 代码 比 完成 相同 任务 的 
任何 其 他 代码 更 快 , 或 至 少 一 样 快 。 

现在 ,编译 器 所 作 的 代码 优化 变 得 更 加 重要 ,而 且 更 加 复杂 。 之 所 以 变 得 更 加 复杂 , 是 因为 
处 理 器 体系 结构 变 得 更 加 复杂 ， 也 有 了 更 多 改进 代码 执行 方式 的 机 会 。 之 所 以 变 得 更 加 重要 , 是 
因为 巨型 并 发 计算 机 要 求实 质 性 的 优化 , 否则 它们 的 性 能 将 会 呈 数 量 级 地 下 降 。 随 着 多 核 计算 
机 (这 些 计算 机 上 的 芯片 拥有 多 个 处 理 器 ) 日 益 流 行 , 所 有 的 编译 器 都 将 面临 充分 利用 多 处 理 器 
计算 机 的 优势 的 问题 。 

即使 有 可 能 通过 随意 的 方法 来 建造 一 个 健壮 的 编译 器 , 实现 起 来 也 是 非常 困难 的 。 因 此 ， 人 们 
已 经 围绕 代码 优化 建立 了 一 套 广泛 且 有 用 的 理论 。 应 用 严格 的 数学 基础 , 使 得 我 们 可 以 证 明 一 个 优 
化 是 正确 的 , 并 且 它 对 所 有 可 能 的 输入 都 产生 预期 的 效果 。 从 第 9 章 开 始 , 我 们 将 会 看 到 , 如 果 想 
使 得 编译 器 产生 经 过 良好 优化 的 代码 , 图 、 和 矩阵 和 线性 规划 之 类 的 模型 是 必 不 可 少 的 。 

从 另 一 方面 来 说 , 只 有 理论 是 不 够 的 。 很 多 现实 世界 中 的 问题 都 没有 完美 的 答案 。 实 际 上 ， 
我 们 在 编译 器 优化 中 提出 的 很 多 问题 都 是 不 可 判定 的 。 在 编译 器 设计 中 , 最 重要 的 技能 之 一 是 
明确 描述 出 真正 要 解决 的 问题 的 能 力 。 我 们 在 一 开始 需要 对 程序 的 行为 有 充分 的 了 解 , 并 且 需 
要 通过 充分 的 试验 和 评价 来 验证 我 们 的 直觉。 

编译 器 优化 必须 满足 下 面 的 设计 目标 : 

© 优化 必须 是 正确 的 , 也 就 是 说 , 不 能 改变 被 编译 程序 的 含义 。 

e 优化 必须 能 够 改善 很 多 程序 的 性 能 。 

e 优化 所 需 的 时 间 必 须 保持 在 合理 的 范围 内 。 

e 所 需要 的 工程 方面 的 工作 必须 是 可 管理 的 。 . 

对 正确 性 的 强调 是 无 论 如 何不 会 过 分 的 。 不 管 设计 得 到 的 编译 器 能 够 生成 运行 速度 多 么 快 的 代 
码 , 只 要 生成 的 代码 不 正确 , 这 个 设计 就 是 毫 无 意义 的 。 正 确 设计 优化 编译 器 是 如 此 困难 , 我 们 敢 说 没 
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有 一 个 优化 编译 器 是 完全 无 错 的 ! 因此 , 设计 一 个 编译 器 时 最 重要 的 目标 是 使 它 正确 。 

第 二 个 目标 是 编译 器 应 该 有 效 提 高 很 多 输入 程序 的 性 能 。 性 能 通常 意味 着 程序 执行 的 速度 。 
我 们 也 希望 能 够 尽 可 能 降低 生成 代码 的 大 小 , 在 嵌 人 式 系 统 中 更 是 如 此 。 而 对 于 移动 设备 的 情 
况 ,尽量 降低 代码 的 能 耗 也 是 我 们 期 待 的 。 在 通常 情况 下 ,提高 执行 效率 的 优化 也 能 够 节约 能 
耗 。 除 了 性 能 ,错误 报告 和 调试 等 的 可 用 性 方面 也 是 很 重要 的 。 

第 三 ,我们 需要 使 编译 时 间 保 持 在 较 短 的 范围 内 ， 以 支持 快速 的 开发 和 调试 周期 。 当 机 器 变 
得 越 来 越 快 , 这 个 要 求 会 越 来 越 容易 达到 。 开 始 时 ,一 个 程序 经 常 在 没有 进行 优化 的 情况 下 开发 
和 调试。 这 么 做 不 仅 可 以 降低 编译 时 间 , 更 重要 的 是 未 经 优化 的 程序 比较 容易 调试 。 这 是 因为 
编译 器 引入 的 优化 经 常 使 得 源 代码 和 目标 代码 之 间 的 关系 变 得 模糊 。 在 编译 器 中 开启 优化 有 时 
会 暴露 出 源 程 序 中 的 新 问题 , 因此 需要 对 经 过 优化 的 代码 再 次 进行 测试 。 因 为 可 能 需要 额外 的 
测试 工作 , 有 时 会 阻止 人 们 在 应 用 中 使 用 优化 技术 , 当 应 用 的 性 能 不 很 重要 的 时 候 更 是 如 此 。 

最 后 ,编译 器 是 一 个 复杂 的 系统 , 我 们 必须 使 系统 保持 简单 以 保证 编译 器 的 设计 和 维护 费用 
是 可 管理 的 。 我 们 可 以 实现 的 优化 技术 有 无 穷 多 种 ,而 创建 一 个 正确 有 效 的 优化 过 程 需要 相当 
大 的 工作 量 。 我 们 必须 划分 不 同 优化 技术 的 优先 级 别 , 只 实现 那些 可 以 对 实践 中 遇 到 的 源 程 序 
带 来 最 大 好 处 的 技术 。 

因此 , 我 们 在 研究 编译 器 时 不 仅 要 学 习 如 何 构造 一 个 编译 器 , 还 要 学 习 解 决 复杂 和 开放 性 问 
题 的 一 般 方法 学 。 在 编译 器 开发 中 用 到 的 方法 涉及 理论 和 实验 。 在 开始 的 时 候 , 我 们 通常 根据 
直 沉 确定 有 哪些 重要 的 问题 并 把 它们 明确 描述 出 来 。 


1.5 编译 技术 的 应 用 


编译 器 设计 并 不 只 是 关于 编译 器 的 。 很 多 人 用 到 了 在 学 校 里 研究 编译 器 时 学 到 的 技术 , 但 
是 严格 地 说 ,它们 从 没有 为 一 个 主流 的 程序 设计 语言 编写 过 一 个 编译 器 (甚至 其 中 的 一 部 分 ) 。 
编译 器 技术 还 有 其 他 重要 用 途 。 另 外 ,编译 器 设计 影响 了 计算 机 科学 中 的 其 他 领域 。 在 本 节 , 我 
们 将 回顾 和 编译 技术 有 关 的 最 重要 的 互动 和 应 用 。 
1.5.1 高 级 程序 设计 语言 的 实现 

一 个 高 级 程序 设计 语言 定义 了 一 个 编程 抽象 : 程序 员 使 用 这 个 语言 表达 算法 ,而 编译 器 必须 
把 这 个 程序 翻译 成 目标 语言 。 总 的 来 说 , 用 高 级 程序 设计 语言 编程 比较 容易 ,但 是 比较 低 效 , 也 
就 是 说 , 目标 程序 运行 较 慢 。 使 用 低级 程序 设计 语言 的 程序 员 能 够 更 多 地 控制 一 个 计算 过 程 , 因 
此 从 原则 上 讲 ， 可 以 产生 更 加 高 效 的 代码 。 遗 憾 的 是 ,低级 程序 比较 难 编写 ， 而 且 更 糟糕 的 是 可 
移植 性 较 差 , 更 容易 出 错 ,而 且 更 加 难以 维护 。 优 化 编译 器 包括 了 提高 所 生成 代码 性 能 的 技术 ， 
因此 弥补 了 因 高 层次 抽象 而 引 和 的 低 效 率 。 
C 语言 中 的 关键 字 register 是 编译 器 技术 和 语言 发 展 互动 的 一 个 较 早 的 例子 。 当 C 语 
言 在 20 世纪 70 年 代 中 期 被 创立 时 , 人们 认为 有 必要 让 程序 员 来 控制 哪个 程序 变量 应 该 存放 在 寄 
存 器 中 。 当 有 效 的 寄存 器 分 配 技术 出 现 后 , 这 个 控制 变 得 没有 必要 了 ,大 多 数 现代 的 程序 不 再 使 
用 这 个 语言 特征 。 

实际 上 , 使 用 关键 字 register 的 程序 还 可 能 损失 效率 ,因为 寄存 器 分 配 是 一 类 很 低层 次 的 问 
题 , 程序 员 常 常 不 是 最 好 的 判断 这 类 问题 的 人 选 。 寄 存 器 分 配 的 最 优选 择 很 大 程度 上 取决 于 一 
个 机 器 的 体系 结构 的 特点 。 把 低层 次 资源 管理 的 决策 ， 比 如 寄存 器 分 配 ， 写 死 在 程序 中 反而 有 可 
能 损害 性 能 。 当 运行 程序 的 计算 机 有 别 于 当初 所 设 定 的 目标 机 时 更 是 如 此 。 口 

对 于 程序 设计 语言 的 选择 的 变化 与 不 断 提高 抽象 层次 的 方向 是 一 致 的 。C 语言 是 在 20 世纪 
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80 年 代 主 流 的 系统 程序 设计 语言 ; 20 世纪 90 年 代 开 始 的 很 多 项 目 则 选择 C++ ; 在 1995 年 推出 
的 Java 很 快 在 20 世纪 90 年 代 后 期 流行 起 来 。 在 每 一 轮 中 引入 的 新 的 程序 设计 语言 特征 都 会 推 
动 对 于 编译 器 优化 的 新 研究 。 接 下 来 , 我 们 将 给 出 一 个 关于 主要 语言 特征 的 概览 , 这 些 特征 曾经 
推动 了 编译 器 技术 的 重要 发 展 。 

在 实践 中 ,所 有 的 通用 程序 设计 语言 , 包括 C、Fortran 和 Cobol, 都 支持 用 户 定义 的 聚合 类 型 
(如 数组 和 结构 ) 和 高 级 控制 流 ( 比如 循环 和 过 程 调用 ) 。 如 果 我 们 仅仅 把 每 个 高 级 结构 和 数据 存 
取 运 算 直 接 翻 译 成 为 机 器 代码 , 得 到 的 代码 将 会 非常 低 效 。 编 译 器 优化 的 一 个 组 成 部 分 称 为 数 
据 流 优化 ， 它 可 以 对 程序 的 数据 流 进 行 分 析 , 并 消除 这 些 构 造 之 间 的 宛 余 。 它 们 很 有 效 , 生成 的 
代码 和 一 个 熟练 的 低级 语言 程序 员 所 写 的 代码 类 似 。 

面向 对 象 概念 首先 于 1967 年 在 Simula 中 引入 ,并 被 集成 到 Smalltalk, C++ 、C# 和 Java 这 样 
的 语言 中 。 面 向 对 象 的 主要 思想 是 

1) 数据 抽象 

2) 特性 的 继承 

人 们 发 现 这 两 者 都 可 以 使 得 程序 更 加 模块 化 和 易于 维护 。 面 向 对 象 程序 和 用 很 多 其 他 语言 
写 的 程序 之 间 的 不 同 在 于 它们 由 多 得 多 的 (但 是 较 小 ) 过 程 (在 面向 对 象 术语 中 称 为 方法 (method) ) 
组 成 。 因 此 , 编译 器 优化 技术 必须 能 够 很 好 地 跨越 源 程序 中 的 过 程 边界 进行 优化 。 过 程 内 联 技 
术 ( 即 把 一 个 过 程 调用 替换 为 相应 过 程 体 ) 在 这 里 是 非常 有 用 的 。 人 们 还 开发 了 可 以 加 速 虚 拟 方 
法 分 发 的 优化 技术 。 

Java 有 很 多 特征 可 以 使 编程 变 得 更 容易 ， 其 中 的 很 多 特征 之 前 已 经 在 别 的 语言 中 引入 。Java 
语言 是 类 型 安全 的 ; 也 就 是 说 , 一 个 对 象 不 能 被 当 作 另 一 个 无 关 类 型 的 对 象 来 使 用 。 所 有 的 数组 
访问 运算 都 会 被 检查 以 保证 它们 在 数组 的 界限 之 内 。jJava 没有 指针 , 也 不 允许 指针 运算 。 它 具有 
一 个 肉 建 的 垃圾 收集 机 制 来 自动 释放 那些 不 再 使 用 的 变量 所 占用 的 内 存 。 昌 然 所 有 这 些 特征 使 
得 编程 变 得 更 加 容易 , 但 它们 也 会 引起 运行 时 刻 的 开销 。 人 们 开发 了 相应 的 编译 优化 技术 来 降 
低 这 个 开销 。 比 如 ,消除 不 必要 的 下 标 范围 检查 , 以 及 把 那些 在 过 程 之 外 不 可 访问 的 对 象 分 配 在 
栈 里 而 不 是 堆 里 。 此 外 ,， 人们 还 开发 了 高 效 的 算法 来 尽量 降低 垃圾 收集 的 开销 。 

除 此 之 外 ,Java 用 来 支持 可 移植 和 可 移动 的 代码 。 程 序 以 Java 字 节 码 的 方式 分 发 。 这 些 字 
节 码 要 么 被 解释 执行 ,要 么 被 动态 地 ( 即 在 运行 时 刻 ) 编译 为 本 地 代码 。 动 态 编译 也 曾经 在 其 他 
上 下 文 环境 中 被 研究 过 。 在 那里 , 信息 在 运行 时 刻 被 动态 地 抽取 出 来 , 并 用 来 生成 更 加 优化 的 代 
码 。 在 动态 编译 中 , 尽 可 能 降低 编译 时 间 是 很 重要 的 , 因为 编译 时 间 也 是 运行 开销 的 一 部 分 。 一 
个 常用 的 技术 是 只 编译 和 优化 那些 经 常 运行 的 程序 片断 。 

1. 5.2 针对 计算 机 体系 结构 的 优化 

计算 机 体系 结构 的 快速 发 展 也 对 新 编译 器 技术 提出 了 越 来 越 多 的 需求 。 几 乎 所 有 的 高 性 能 
系统 都 利用 了 两 种 技术 : 3-47 (parallelism) Al A AA 2 4 # (memory hierarchy) 。 并 行 可 以 出 现在 
多 个 层次 上 : 在 指令 层次 上 , 多 个 运算 可 以 被 同时 执行 ; 在 处 理 器 层次 上 , 同一 个 应 用 的 多 个 不 
同 线程 在 不 同 的 处 理 器 上 运行 。 内 存 层 次 结构 是 应 对 下 述 局 限 性 的 方法 ; 我 们 可 以 制造 非常 快 
的 内 存 , 或 者 非常 大 的 内 存 , 但 是 无 法 制造 非常 大 又 非常 快 的 内 存 。 

并 行 性 | 

所 有 的 现代 微 处 理 器 都 采用 了 指令 级 并 行 性 。 但 是 ,这 种 并 行 性 可 以 对 程序 员 隐 藏 起 来 。 
程序 员 写 程序 的 时 候 就 好 像 所 有 指令 都 是 顺序 执行 的 。 硬 件 动态 地 检测 顺序 指令 流 之 间 的 依赖 
KA, 并 且 在 可 能 的 时 候 并 行 地 发 出 指令 。 在 有 些 情况 下 ,机 器 包含 一 个 硬件 调度 器 。 该 调度 器 
可 以 改变 指令 的 顺序 以 提高 程序 的 并 行 性 。 不 管 硬件 是 否 对 指令 进行 重新 排序 , 编译 器 都 可 以 
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重新 安排 指令 ,以 使 得 指令 级 并 行 更 加 有 效 。 

指令 级 的 并 行 也 显 式 地 出 现在 指令 集中 。VLIW( Very Long Instruction Word, 非常 长 指令 字 ) 
机 器 拥有 可 并 行 执行 多 个 运算 的 指令 。Intel IA64 是 这 种 体系 结构 的 一 个 有 名 的 例子 。 所 有 的 高 
性 能 通用 微 处 理 器 还 包含 了 可 以 同时 对 一 个 向 量 中 的 所 有 数据 进行 运算 的 指令 。 人 们 已 经 开发 
出 了 相应 的 编译 器 技术 ， 从 顺序 程序 出 发 为 这 样 的 机 器 自动 生成 代码 。 

多 处 理 器 也 已 经 日 益 流行 , 即使 个 人 计算 机 也 拥有 多 个 处 理 器 。 程 序 员 可 以 为 多 处 理 器 编 
写 多 线程 的 代码 , 也 可 以 通过 编译 器 从 传统 的 顺序 程序 自动 生成 并 行 代码 。 这 样 的 编译 器 对 程 
序 员 隐藏 了 一 些 细节 , 包括 如 何在 程序 中 找到 并 行 性 , 如 何在 机 器 中 分 发 计算 任务 , 以 及 如 何 最 
小 化 处 理 器 之 间 的 同步 和 通信 。 很 多 科学 计算 和 工程 性 应 用 需要 进行 高 强度 的 计算 ,因此 可 以 
从 并 行 处 理 中 得 到 很 大 的 好 处 。 人 们 已 经 开发 了 并 行 技术 以 便 自动 地 把 顺序 的 科学 计算 程序 番 
译 成 为 多 处 理 器 代码 。 

内 存 层 次 结构 

一 个 内 存 层 次 结构 由 几 层 具有 不 同 速度 和 大 小 的 存储 器 组 成 。 离 处 理 器 最 近 的 层 速度 最 快 
但 是 容量 最 小 。 如 果 一 个 程序 的 大 部 分 内 存 访问 都 能 够 由 层次 结构 中 最 快 的 层 满 足 , 那么 程序 
的 平均 内 存 访问 时 间 就 会 降低 。 并 行 性 和 内 存 层次 结构 的 存在 都 会 提高 一 个 机 器 的 潜在 性 能 。 
但 是 ,它们 必须 被 编译 器 有 效 利 用 才能 够 真正 为 一 个 应 用 提供 高 性 能 计算 。 

内 存 层次 结构 可 以 在 所 有 的 机 器 中 找到 。 一 个 处 理 器 通常 有 少量 的 几 百 个 字 节 的 寄存 器 ， 
几 层 包含 了 几 天 到 几 兆 字 节 的 高 速 缓存 , 包含 了 几 兆 到 几 G 字 节 的 物理 寄存 器 ,最 后 还 包括 多 
个 几 G 字 节 的 外 部 存储 器 。 相 应 地 ; 层次 结构 中 相 邻 层次 间 的 存 取 速 度 会 有 两 到 三 个 数量 级 上 
的 差异 。 系 统 性 能 经 常 受 到 内 存 子 系统 的 性 能 (而 不 是 处 理 器 的 性 能 ) 的 限制 。 虽 然 一 般 来 说 纺 
译 器 注重 优化 处 理 器 的 执行 , 现在 人 们 更 多 地 强调 如 何 使 得 内 存 层 次 结构 更 加 高 效 。 

高 效 使 用 寄存 器 可 能 是 优化 一 个 程序 时 要 处 理 的 最 重要 的 问题 。 和 寄存 器 必须 由 软件 明确 
管理 不 同 , 高 速 缓存 和 物理 内 存 是 对 指令 集合 隐藏 的 , 并 由 硬件 管理 。 人 们 发 现 , 由 硬件 实现 的 
高 速 缓存 管理 策略 有 时 并 不 高 效 。 当 处 理 具有 大 型 数据 结构 (通常 是 数组 ) 的 科学 计算 代码 时 更 
是 如 此 。 我 们 可 以 改变 数据 的 布局 或 数据 访问 代码 的 顺序 来 提高 内 存 层次 结构 的 效率 。 我 们 也 
可 以 通过 改变 代码 的 布局 来 提高 指令 高 速 缓存 的 效率 。 

1.5.3 ”新 计算 机 体系 结构 的 设计 

在 计算 机 体系 结构 设计 的 早期 , 编译 器 是 在 机 器 建造 好 之 后 再 开发 的 。 现 在 , 这 种 情况 已 经 
有 所 改变 。 因 为 使 用 高 级 程序 设计 语言 是 一 种 规范 , 决定 一 个 计算 机 系统 性 能 的 不 是 它 的 原始 
速度 , 还 包括 编译 器 能 够 以 何 种 程度 利用 其 特征 。 因 此 , 在 现代 计算 机 体系 结构 的 开发 中 , 编译 
器 在 处 理 器 设计 阶段 就 进行 开发 ， 然 后 编译 得 到 代码 并 运行 于 模拟 器 上 。 这 些 代码 被 用 来 评价 
提议 的 体系 结构 特征 。 

RISC j 

有 关 编 译 器 如 何 影响 计算 机 体系 结构 设计 的 最 有 名 的 例子 之 一 是 RISC ( Reduced Instruction- 
Set Computer， 精 简 指 令 集 计算 机 ) 的 发 明 。 在 发 明 RISC 之 前 , 趋势 是 开发 的 指令 集 越 来 越 复杂 ， 
以 使 得 汇编 编程 变 得 更 容易 。 这 些 体系 结构 称 为 CISC( Complex Instruction-Set Computer, 复杂 指 
令 集 计算 机 )。 比 如 ,CISC 指令 集 包含 了 复杂 的 内 存 寻 址 模式 来 支持 对 数据 结构 的 访问 , 还 包含 
了 过 程 调 用 指令 来 保存 寄存 器 和 向 栈 中 传递 参数 。 

编译 器 优化 经 常 能 够 消除 复杂 指令 之 间 的 元 余 , 把 这 些 指 令 削 减 为 少量 较 简 单 的 运算 。 因 
此 ,人 们 期 望 设计 出 简单 指令 集 。 编 译 器 可 以 有 效 地 使 用 它们 , 而 硬件 也 更 容易 进行 优化 。 

大 部 分 通用 处 理 器 体系 结构 ， 包括 PowerPC、SPARC、MIPS、 Alpha 和 PA-RISC, 都 是 基于 
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RISC 概念 的 。 昌 然 x86 体系 结构 (最 流行 的 微 处 理 器 ) 具 有 CISC 指令 集 , 但 在 这 个 处 理 器 本 身 的 
实现 中 使 用 了 很 多 为 RISC 机 器 发 展 得 到 的 思想 。 不 仅 如 此 , 使 用 高 性 能 x86 机 器 的 最 有 效 的 方 
法 是 仅 使 用 它 的 简单 指令 。 

专用 体系 结构 

在 过 去 的 30 年 中 , 提出 了 很 多 的 体系 结构 概念 。 其 中 包括 : 数据 流 机 器 、 向 量 机 、VLIW( 非常 
长 指令 字 ) 机 器 、SIMD( 单 指令 , 多 数据 ) 处 理 器 阵列 、 心 动 阵列 (systolic array) 、 共 享 内 存 的 多 处 理 
器 、 分 布 式 内 存 的 多 处 理 器 。 每 种 体系 结构 概念 的 发 展 都 伴随 着 相应 编译 器 技术 的 研究 和 发 展 。 

这 些 思想 中 的 一 部 分 已 经 应 用 到 艇 人 式 机 器 的 设计 中 。 因 为 整个 系统 都 可 以 放 到 一 个 芯片 
里 面 , 所 以 处 理 器 不 再 是 预 包装 的 商品 。 人 们 可 以 针对 特定 应 用 进行 裁剪 以 获得 更 好 的 费 效 比 。 
由 于 规模 经 济 效用 , 通用 处 理 器 的 体系 结构 具有 趋同 性 。 而 专用 应 用 的 处 理 器 则 与 此 相反 ,体现 
出 了 计算 机 体系 结构 的 多 样 性 。 人 们 不 仅 需 要 编译 器 技术 来 为 这 些 体系 结构 编程 提供 支持 ,也 
需要 用 它们 来 评价 拟 议 中 的 体系 结构 设计 。 

1.5.4 程序 翻译 Í 

我 们 通常 把 编译 看 作 是 从 一 个 高 级 语言 到 机 器 语言 的 翻译 过 程 。 同 样 的 技术 也 可 以 应 用 到 
不 同 种 类 的 语言 之 间 的 翻译 。 下 面 是 程序 翻译 技术 的 一 些 重要 应 用 。 

二 进 制 翻译 

编译 器 技术 可 以 用 于 把 一 个 机 器 的 二 进 制 代码 翻译 成 另 一 个 机 器 的 二 进 制 代码 , 使 得 可 以 
在 一 个 机 器 上 运行 原本 为 男 一 个 指令 集 编译 的 程序 。 二 进 制 翻译 技术 已 经 被 不 同 的 计算 机 公司 
用 来 增加 它们 的 机 器 上 的 可 用 软件 。 特 别 地 ， 因为 x86 在 个 人 计算 机 市 场 上 的 主导 地 位 , 很 多 软 
件 都 是 以 x86 二 进 制 代码 的 形式 提供 的 。 人 们 开发 了 二 进 制 代码 翻译 器 , 把 x86 代码 转换 成 
Alpha 和 Spare 的 代码 。Transmeta 公司 也 在 他 们 的 x86 指令 集 实现 中 使 用 了 二 进 制 转换 。 他 们 没 
有 直接 在 硬件 上 运行 复杂 的 x86 指令 集 , 他 们 的 Ttransmeta Crusoe 处 理 器 是 一 个 VLIW 处 理 器 ， 
它 依 赖 于 二 进 制 翻译 器 来 把 x86 代码 转换 成 为 本 地 的 VLIW 代码 。 

二 进 制 翻译 也 可 以 被 用 来 提供 向 后 兼容 性 。1994 年 ， 当 Apple Macintosh 中 的 处 理 器 从 
Motorola MC68040 变 为 PowerPC 的 时 候 , 便 使 用 二 进 制 翻译 来 支持 PowerPC 处 理 器 运行 遗留 下 来 
的 MC68040 代码 。 

硬件 合成 

不 仅仅 大 部 分 软件 是 用 高 级 语言 描述 的 , 连 大 部 分 硬件 设计 也 是 使 用 高 级 硬件 描述 语言 
述 的 , 这 些 语言 有 Verilog 和 VHDL( Very high-speed integrated circuit Hardware Description Lan- 
guage, 其 高 速 集成 电路 硬件 描述 语言 )。 硬 件 设 计 通 常 是 在 寄存 器 传输 层 ( Register Transfer Level , 
RTL) 上 描述 的 。 在 这 个 层 中 , 变量 代表 寄存 器 ， 而 表达 式 代 表 组 合 逻 辑 。 硬 件 合成 工具 把 RIL 
描述 自动 翻译 成 为 门 电路 ， 而 门 电路 再 被 翻译 成 为 晶体 管 ,最 后 生成 一 个 物理 布局 。 和 程序 设计 
语言 的 编译 器 不 同 , 这 些 工具 经 常会 花费 几 个 小 时 来 优化 门 电路 。 还 存在 一 些 用 来 翻译 更 高 层 
次 (比如 行为 和 函数 层次 ) 的 设计 描述 的 技术 。 

数据 查询 解释 器 

除了 描述 软件 和 硬件 , 语言 在 很 多 应 用 中 都 是 有 用 的 。 比 如 , 查询 语言 (特别 是 SQL 语言 
(Structured Query Language, 结构 化 查询 语言 ) 被 用 来 搜索 数据 库 。 数 据 库 查 询 由 包含 了 关系 和 布 
尔 运算 符 的 断言 组 成 。 它 们 可 以 被 解释 , 也 可 以 编译 为 代码 ,以 便 在 一 个 数据 库 中 搜索 满足 这 个 
斯 言 的 记录 。 

编译 然后 模拟 

模拟 是 在 很 多 科学 和 工程 领域 内 使 用 的 通用 技术 。 它 用 来 理解 一 个 现象 或 者 验证 一 个 设计 。 
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模拟 器 的 输入 通常 包括 设计 描述 和 某 次 特定 模拟 运行 的 具体 输入 参数 。 模 拟 可 能 会 非常 昂贵 。 
我 们 通常 需要 在 不 同 的 输入 集合 中 模拟 很 多 可 能 的 设计 选择 。 而 每 个 实验 可 能 需要 在 高 性 能 计 
算 机 上 花费 几 天 时 间 才 能 完成 。 另 一 个 方法 不 需要 写 一 个 模拟 器 来 解释 这 些 设计 。 它 对 设计 进 
行 编译 并 生成 能 够 在 机 器 上 直接 模拟 特定 设计 的 机 器 代码 。 后 者 的 运行 更 加 快 。 经 过 编译 的 模 
拟 运行 可 以 比 基 于 解释 器 的 方法 快 几 个 数量 级 。 在 那些 可 以 模拟 用 Verilog 或 VHDL 描述 的 设计 
的 最 新 工具 中 ， 人 们 都 使 用 了 编译 后 模拟 的 技术 。 
1.5.5 软件 生产 率 工 具 

程序 可 以 说 是 人 类 迄今 为 止 生产 出 的 最 复杂 的 工程 制品 , 它们 包含 了 很 多 很 多 的 细节 。 要 
使 得 程序 能 够 完全 正确 运行 , 每 个 细节 都 必须 是 正确 的 。 结 果 是 程序 中 的 错误 很 是 独 狐 。 错 误 
可 以 使 一 个 系统 崩 演 , 产生 错误 的 输出 , 使 得 系统 容易 受到 安全 性 攻击 , 在 关键 系统 中 甚至 会 引 
起 灾难 性 的 运行 错误 。 测 试 是 对 系统 中 的 错误 进行 定位 的 主要 技术 。 

一 个 很 有 意思 且 很 有 前 景 的 辅助 性 方法 是 通过 数据 流 分 析 技 术 静 态 地 ( 即 在 程序 运行 之 前 ) 

定位 错误 。 数 据 流 分 析 可 以 在 所 有 可 能 的 执行 路 径 上 找到 错误 , 而 不 是 像 程序 测试 的 时 候 所 做 
的 那样 , 仅仅 是 在 那些 由 输入 数据 组 合 执行 的 路 径 上 找 错误 。 很 多 原本 为 编译 髓 优化 所 开发 的 
数据 流 分 析 技 术 可 以 用 来 创建 相应 的 工具 , 帮助 程序 员 完 成 他 们 的 软件 工程 任务 。 

找到 程序 的 所 有 错误 是 不 可 判定 问题 。 可 以 设计 一 个 数据 流 分 析 方 法 来 找 出 所 有 可 能 带 有 
某 种 错误 的 语句 ,对 程序 员 发 出 警告 。 但 是 如 果 这 些 警 告 中 的 大 部 分 都 是 误 报 , 用 户 将 不 会 使 用 
这 个 工具 。 因 此 , 实用 的 错误 检测 器 经 常 既 不 是 健全 的 也 不 是 完全 的 。 也 就 是 说 , 它们 不 可 能 找 
出 程序 中 的 所 有 错误 , 也 不 能 保证 报告 的 所 有 错误 都 真正 是 错误 。 虽然 如 此 ， 人 们 仍然 开发 了 很 
多 种 静态 分 析 工 具 , 这 些 工具 能 够 在 实际 程序 中 有 效 地 找到 错误 ， 比 如 释放 空 指针 或 已 释放 过 的 
指针 。 错 误 探 测 器 可 以 是 不 健全 的 。 这 个 事实 使 得 它们 和 编译 器 的 优化 有 着 显著 不 同 。 优 化 器 
必须 是 保守 的 , 在 任何 情况 下 都 不 能 改变 程序 的 语义 

在 本 节 中 , 我 们 将 提 到 使 用 程序 分 析 技 术 来 所 高 软件 生产 效率 的 几 个 已 有 途径 。 这 些 分 析 
是 在 原本 为 编译 器 代码 优化 而 开发 的 技术 的 基础 上 建立 的 。 其 中 静态 探测 一 个 程序 是 否 具 有 安 
全 漏洞 的 技术 是 极为 重要 的 。 

类 型 检查 

类 型 检查 是 一 种 有 效 的 , 且 被 充分 研究 的 技术 , 它 可 以 被 用 于 捕 提 程序 中 的 不 一 致 性 。 它 可 以 
用 来 检测 一 些 错误 ， 比 如, 运算 被 作用 于 错误 类 型 的 对 象 上 , 或 者 传递 给 一 个 过 程 的 参数 和 该 过 程 
的 范 型 (signature) 不 匹配 。 通 过 分 析 程 序 中 的 数据 流 , 程序 分 析 还 可 以 做 出 比 检查 类 型 错误 更 多 的 
THE. Han, 一 个 指针 被 赋予 了 NULL 值 , 然后 又 立刻 被 释放 了 ,这 个 程序 显然 是 错误 的 。 

这 个 技术 也 可 以 用 来 捕捉 某 种 安全 漏洞 。 其 中 , 攻击 者 可 以 向 程序 提供 一 个 字符 串 或 者 其 
他 数据 ,而 这 些 数据 没有 被 程序 谨慎 使 用 。 一 个 用 户 提 供 的 字符 串 可 以 被 加 上 一 个 “危险 ”的 标 
号 。 如 果 没 有 检查 这 个 字符 串 是 否 满足 特定 的 格式 , 那么 它 仍然 是 “危险 " 的 。 如 果 这 种 类 型 的 
字符 串 能 够 在 某 个 程序 点 上 影响 代码 的 控制 流 , 那么 就 存在 一 个 潜在 的 安全 漏洞 。 

边界 检查 

相对 于 较 高 级 的 程序 设计 语言 而 言 , 用 较 低级 语言 编程 更 加 容易 犯错 。 比 如 , 很 多 系统 中 的 
安全 漏 润 都 是 因为 用 C 语言 编写 的 程序 中 的 缓冲 区 滋 出 造成 的 。 因 为 C 语言 没有 数组 边界 检查 ， 
所 以 必须 由 用 户 来 保证 对 数组 的 访问 没有 超出 边界 。 因 为 不 能 检验 用 户 提 供 的 数据 是 否 可 能 溢 
出 一 个 缓冲 区 , 程序 可 能 被 坎 骗 , 把 一 个 数据 存放 到 缓冲 区 之 外 。 攻 击 者 可 以 巧妙 处 理 这 些 数 
据 , 使 得 程序 做 出 错误 的 行为 , 从 而 危及 系统 的 安全 。 人 们 已 经 开发 了 一 些 技术 来 寻找 程序 中 的 
缓冲 区 溢出 , 但 收效 并 不 显著 。 
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如 果 程 序 是 用 一 种 包含 了 自动 区 间 检 查 的 安全 的 语言 编写 的 , 这 个 问题 就 不 会 发 生 。 用 来 
消除 程序 中 的 宛 余 区 间 检 查 的 数据 流 分 析 技 术 也 可 以 用 来 定位 缓冲 区 溢出 错误 。 而 最 大 区 别 在 
F, 没 能 消除 某 个 区 间 检 查 仅仅 会 导致 很 小 的 额外 运行 时 刻 开销 , 而 没有 指出 一 个 潜在 的 缓冲 区 
溢出 错误 却 可 能 危及 系统 的 安全 性 。 因 此 , 虽然 使 用 简单 的 技术 去 进行 区 间 检 查 优化 就 已 经 足 
ET, 但 在 错误 探测 工具 中 获得 高 质量 的 结果 则 需要 复杂 的 分 析 技术 ,比如 在 过 程 之 间 跟 踪 指 针 


值 的 技术 。 
内 存 管 理工 具 
垃圾 收集 机 制 是 在 效率 和 易 编 程 及 软件 可 靠 性 之 间 进 行 折 衷 处 理 的 另 一 个 极 好 的 例子 。 自 


动 的 内 存 管理 消除 了 所 有 的 内 存 管 理 错误 ( 比如 内 存 泄漏 )。 这 些 错误 是 C 或 C ++ 程序 中 问题 
的 主要 来 源 之 一 。 人 们 开发 了 很 多 工具 来 帮助 程序 员 寻 找 内 存 管理 错误 。 比 如 ，Purify 是 一 个 能 
够 动态 地 捕捉 内 存 管理 错误 的 被 广泛 使 用 的 工具 。 还 有 一 些 能 够 帮助 静态 识别 部 分 此 类 错误 的 
工具 也 已 经 被 开发 出 来 。 


1.6 程序 设计 语言 基础 


这 一 节 我 们 将 讨论 在 程序 设计 语言 的 研究 中 出 现 的 最 重要 的 术语 和 它们 的 区 别 。 我 们 的 目 
标 并 不 是 涵盖 所 有 的 概念 或 所 有 常见 的 程序 设计 语言 。 我 们 假设 读者 已 经 至 少 熟悉 C、C ++、 
C# 或 Java 中 的 一 种 语言 ， 并 且 也 可 能 已 经 遇 到 过 其 他 语言 。 

1.6.1 静态 和 动态 的 区 别 

在 为 一 个 语言 设计 一 个 编译 器 时 , 我 们 所 面 对 的 最 重要 的 问题 之 一 是 编译 器 能 够 对 一 个 程 
序 做 出 哪些 判定 。 如 果 一 个 语言 使 用 的 策略 支持 编译 器 静态 决定 某 个 问题 ,那么 我 们 说 这 个 语 
言 使 用 了 一 个 静态 (static ) 策略 , 或 者 说 这 个 问题 可 以 在 编译 时 刻 (compile time) 决 定 。 另 一 方面 ， 
一 个 只 允许 在 运行 程序 的 时 候 做 出 决定 的 策略 被 称 为 动态 策略 (dynamic policy) ,或 者 被 认为 需 
要 在 运行 时 刻 (run time) 做 出 决定 。 

我 们 需要 注意 的 另 一 个 问题 是 声明 的 作用 域 。x 的 一 个 声明 的 作用 域 (scope) 是 指 程序 的 一 
个 区 域 , 在 其 中 对 x 的 使 用 都 指向 这 个 声明 。 如 果 仅 通过 阅读 程序 就 可 以 确定 一 个 声明 的 作用 
R, 那么 这 个 语言 使 用 的 是 静态 作用 域 (static scope), 或 者 说 词法 作用 域 (lexical scope), WA, 
这 个 语言 使 用 的 是 动态 作用 域 ( dynamic scope) 。 如 果 使 用 动态 作用 域 ， 当 程序 运行 时 ， 同 一 个 对 
x 的 使 用 会 指向 x 的 几 个 声明 中 的 某 一 个 。 

大 部 分 语言 (比如 C 和 Java) 使 用 静态 作用 域 。 我 们 将 在 1. 6. 3 节 中 讨论 静态 作用 域 。 
Cee, 作为 静态 /动态 区 别 的 另 一 个 例子 , 我 们 考虑 一 下 Java 类 声明 中 术语 static 的 使 用 。 这 
个 术语 作用 于 数据 。 在 Java F, 一 个 变量 是 用 于 存放 数据 值 的 某 个 内 存 位 置 的 名 字 。 这 里 ， 
“static 指 的 并 不 是 变量 的 作用 域 ， 而 是 编译 器 确定 用 于 存放 被 声明 变量 的 内 存 位 置 的 能 力 。 比 
如 声明 


public static int x; 
使 得 x 成 为 一 个 类 变量 (class variable), 也 就 是 说 不 管 创建 了 多 少 个 这 个 类 的 对 象 , 只 存在 一 个 x 
的 拷贝 。 此 外 , 编译 器 可 以 确定 内 存 中 的 被 用 于 存放 整数 x 的 位 置 。 反 过 来 , 如 果 这 个 声明 中 省 
略 了 “static”, 那么 这 个 类 的 每 个 对 象 都 会 有 它 自己 的 用 于 存放 x 的 位 置 , 编译 器 没有 办 法 在 运行 
程序 之 前 预先 确定 所 有 这 些 位 置 。 口 
1.6.2 ”环境 与 状态 

我 们 在 讨论 程序 设计 语言 时 必须 了 解 的 男 一 个 重要 区 别 是 在 程序 运行 时 发 生 的 改变 是 否 会 
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影响 数据 元 素 的 值 , 还 是 影响 了 对 那个 数据 的 名 字 的 解释 。 比 如 ,执行 像 x =y +1 这 样 的 赋值 
语句 会 改变 名 字 x 所 指 的 值 。 更 加 明确 地 说 ,这 个 赋值 改变 了 x 所 指向 的 内 存 位 置 上 的 值 。 

可 能 下 面 这 一 点 就 不 是 那么 明显 了 。 妈 x 所 指 的 位 置 也 可 能 在 运行 时 刻 改 变 。 比 如 , 我 们 在 例 
1.3 中 讨论 过 , WR x 不 是 一 个 静态 (或 者 说 “类 ” ) 变 量 , 那么 这 个 类 的 每 一 个 对 象 都 有 它 自 己 的 分 
配给 变量 x 的 实例 的 位 置 。 这 种 情况 下 , 对 x 的 赋值 可 能 会 改变 那些 “实例 "变量 中 的 某 一 个 变量 的 
值 , 这 取决 于 包含 这 个 赋值 的 方法 作用 于 哪个 对 象 。 s 





环境 状态 
名 字 和 内 存 ( 存 储 ) 位 置 的 关联 ,及 之 后 和 值 的 关联 可 以 用 两 ~ 
个 映射 来 描述 。 这 两 个 映射 随 着 程序 的 运行 而 改变 ( 见 图 1.8) 。 ”名 学 内 存 位 入 i 


1) 环境 ( environment) 是 一 个 从 名 字 到 存储 位 置 的 映射 。 


因为 变量 就 是 指 内 存 位 置 ( 即 CBS PRR AR”), 我 们 ”图 1-8 从 名 字 到 值 的 两 步 映射 
还 可 以 换 一 种 方法 ,把 环境 定义 为 从 名 字 到 变量 的 映射 。 

2) 状态 (state) 是 一 个 从 内 存 位置 到 它们 的 值 的 映射 。 以 C 语言 的 术语 来 说 , 即 状态 把 左 值 
映射 为 它们 的 相应 右 值 。 

环境 的 改变 需要 遵守 语言 的 作用 域 规则 。 
| 考虑 图 1.9 中 的 C 程序 片断 。 整 数 i 被 声明 为 一 个 全 局 变量 , 同时 也 被 声明 为 局 部 于 
函数 /的 变量 。 执 行 / 时 , 环境 相应 地 调整 ,使 得 名 字 纪 指向 那个 为 局 部 于 了 的 那个 i 所 保留 的 存 
WE, 且 i 的 所 有 使 用 (如 图 中 明确 显示 的 赋值 语句 i =3 ) 都 指向 这 个 位 置 。 局 部 的 i 通常 被 
赋予 一 个 运行 时 刻 栈 中 的 位 置 。 

只 要 当 一 个 不 同 于 /的 函数 g 运行 时 , i 的 使 用 就 不 能 指向 那个 局 部 于 /的 i。 在 函数 g 中 对 
名 字 i 的 使 用 必须 位 于 其 他 某 个 对 i 的 声明 的 作用 域内 。 一 个 例子 是 图 中 明确 显示 的 赋值 语句 
x=i+l, 它 位 于 某 个 其 定义 没有 在 图 中 显示 的 过 程 中 。 可 以 假定 i+1 中 的 i 指向 全 局 的 i。 和 
大 多 数 语 言 一 样 ，C 语言 中 的 声明 必须 先 于 其 使 用 ， 




















因此 在 全 局 i 的 声明 之 前 的 函数 不 能 指向 它 。 口 | ine ii PET J 
图 1-8 中 的 环境 和 状态 映射 是 动态 的 , 但 是 也 | asoa 


有 一 些 例外 。 int i; /* BMG + 

1) 名 字 到 位 置 的 静态 绑 定 与 动态 绑 定 。 大 部 分 a 
从 名 字 到 位 置 的 绑 定 是 动态 的 。 我 们 在 这 一 节 中 讨 
论 了 这 种 绑 定 的 几 种 方法 。 某 些 声 明 ( 比如 网 1-9 中 
的 全 局 变量 1) 可 以 在 编译 器 生成 是 标 代码 时 一 劳 永 | Be /* 对 全 局 ; 的 使 用 */ 
逸 地 分 配 一 个 存储 位 置 .9 

2) 从 位 置 到 值 的 静态 绑 定 与 动态 绑 定 。 一 般 来 
说 , 位 置 到 值 的 绑 定 (图 1-8 的 第 二 阶段 ) 也 是 动态 的 , 因为 我 们 无 法 在 运行 一 个 程序 之 前 指出 一 
个 位 置 上 的 值 。 被 声明 的 常量 是 一 个 例外 。 比 如 , C 语言 的 定义 

#define ARRAYSIZE 1000 
把 名 字 ARRAYSIZE 静态 地 绪 定 为 值 1000 。 我 们 看 到 这 个 语句 就 可 以 知道 这 个 绑 定 关系 , 并 且 知 
道 在 程序 运行 时 刻 这 个 绑 定 不 可 能 改变 。 


i = 3; /* 对 局 部 i 的 使 用 */ 








图 1-9 名字 的 两 个 声明 





O ”从 技术 上 来 讲 , C 语言 编 译 器 将 为 全 局 变量 : 分 配 一 个 虚拟 内 存 中 的 位 置 , 而 由 程序 装载 器 和 操作 系统 来 决定 到 底 把 i 分 
配 在 机 器 的 物理 地 址 中 的 什么 地 方 。 但 是 我 们 不 用 担心 像 这 样 的 “重新 分 配 "问题 ,因为 它 对 编译 过 程 没有 影响 。 我 们 按 
照 如 下 的 方式 处 理 地 址 空间 问题 ; 编译 器 在 为 它 的 输出 代码 使 用 地 址 空间 时 , 假设 它 是 在 分 配 物理 内 存 位 置 。 





1.6.3 静态 作用 域 和 块 结构 

包括 C 语言 和 它 的 同类 语言 在 内 的 大 多 数 语 言 使 用 静态 作用 域 。C 语言 的 作用 域 规则 是 基 
于 程序 结构 的 ,一 个 声明 的 作用 域 由 该 声明 在 程序 中 出 现 的 位 置 隐 含 地 决定 。 稍 后 出 现 的 语言 ， 
LEUN C ++, Java 和 C#, 也 通过 诸如 public, private 和 protected 等 关键 字 的 使 用 , 提供 了 对 作用 
域 的 明确 控制 。 

在 本 节 中 , 我 们 将 考虑 块 结构 语言 的 静态 作用 域 规则 ,其 中 块 (block ) 是 声明 和 语句 的 一 个 组 
合 。C 使 用 括号 {和 | 来 界定 一 个 块 。 另 一 种 为 同一 目的 使 用 begin 和 end 的 方法 可 以 追溯 到 Algol。 





名 字 、 标 识 符 和 变量 

虽然 术语 “名 字 " 和 “变量 "通常 指 的 是 同一 个 事物 , 我们 还 是 要 很 小 心地 使 用 它们 ,以 便 
区 别 编译 时 刻 的 名 字 和 名 字 在 运行 时 刻 所 指 的 内 存 位 置 。 

标识 符 (identifier) 是 一 个 字符 串 , 通常 由 字母 和 数字 组 成 。 它 用 来 指向 (标记 ) 一 个 实体 ， 
比如 一 个 数据 对 象 、 过 程 、 类 , 或 者 类 型 。 所 有 的 标识 答 都 是 名 字 , 但 并 不 是 所 有 的 名 字 都 是 


这 里 , x My RAG, Mi x.y 是 一 个 名 字 。 像 x.y 这 样 的 复合 名 字 称 为 受 限 名 字 (qualiied 
name) o o 

变量 指向 存储 中 的 某 个 特定 的 位 置 。 同 一 个 标识 符 被 多 次 声明 是 很 常见 的 事情 , 每 一 个 
这 样 的 声明 引入 一 个 新 的 变量 。 即 使 每 个 标识 符 只 被 声明 一 次 ,一 个 递归 过 程 中 的 局 部 标识 
符 将 在 不 同 的 时 刻 指 向 不 同 的 存储 位 置 。 














D C 语言 的 静态 作用 域 策略 可 以 概述 如 下 : 

1) 一 个 C 程序 由 一 个 顶层 的 变量 和 函数 声明 的 序列 组 成 。 

2) 函数 内 部 可 以 声明 变量 , 变量 包括 局 部 变量 和 参数 。 每 个 这 样 的 声明 的 作用 域 被 限制 在 
它们 所 出 现 的 那个 函数 内 。 

3) AF x 的 一 个 顶层 声明 的 作用 域 包括 其 后 的 所 有 程序 。 但 是 如 果 一 个 函数 中 也 有 一 个 x 
的 声明 , 那么 函数 中 的 那些 语句 就 不 在 这 个 顶层 声明 的 作用 域内 。 

还 有 一 些 关 于 C 语言 的 静态 作用 域 策略 的 细节 用 来 处 理 语句 中 的 变量 声明 。 我 们 将 在 接 下 
来 的 内 容 中 , 以 及 在 例 1.6 中 查看 这 样 的 声明 。 口 





WH. BAMA 
为 了 避免 总 是 说 “过 程 、 函 数 或 方法 ”, 每 次 我 们 要 讨论 一 个 可 以 被 调用 的 子 程序 时 , 我 
们 通常 把 它们 统称 为 “过 程 ”。 但 是 当 明确 地 讨论 某 个 语言 (比如 C) 的 程序 时 有 一 个 例外 。 因 
为 C 语言 具有 函数 , 所 以 我 们 把 它们 称 为 “函数 ”。 或 者 ,如果 我 们 讨论 像 Java 这 样 的 只 有 
“方法 ”的 语言 时 , 我 们 就 使 用 这 个 术语 。 i 
一 个 函数 通常 返回 某 个 类 型 ( 即 * 返 回 类 迎 ”) 的 值 ， 而 一 个 过 程 不 返回 任何 值 。C 和 类 似 
的 语言 只 有 函数 , 因此 它们 把 过 程 当 作 是 具有 特殊 返回 类 型 “void” 的 函数 来 处 理 。“void" 表 
示 没 有 返回 值 。 像 Java 和 C++ 这样 的 面向 对 象 语言 使 用 术语 “方法 ”。 这 些 方 法 可 以 像 函 数 
或 者 过 程 一 样 运行 , 但 是 总 是 和 某 个 特定 的 类 相关 联 。 











在 C 语言 中 , 有 关 块 的 语法 如 下 : 
D 块 是 一 种 语句 。 块 可 以 出 现在 其 他 类 型 的 语句 ( 比如 赋值 语句 ) 所 能 够 出 现 的 任何 地 方 。 
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2) 一 个 块 包含 了 一 个 声明 的 序列 ,然后 再 跟着 一 个 语句 序列 。 这 些 声明 和 语句 用 一 对 括号 
包围 起 来 。 

注意 , 这 个 语法 允许 一 个 块 谋 大 ,在 另 一 个 块 内 。 这 个 衣 套 特性 称 为 块 结构 (block structure) 。 
C 族 语言 都 具有 块 结构 , 但 是 不 能 在 一 个 函数 内 部 定义 另 一 个 函数 。 

如 果 块 B 是 包含 声明 D 的 最 内 层 的 块 , 那么 我 们 说 万 属于 8。 也 就 是 说 , DEB, 且 不 在 
MEF 8 中 的 任何 其 他 块 中 。 

在 一 个 块 结构 语言 中 , 关于 变量 声明 的 静态 作用 域 规 则 如 下 。 如 果 名 字 x 的 声明 D 属于 块 
B, 那么 D 的 作用 域 包 括 整 个 B, 但 是 以 任意 深度 典 套 在 日 中 、 重 新 声明 了 x 的 所 有 块 8' 不 在 此 
作用 域 中 。 这 里 , * 在 B8' 中 重新 声明 是 指 存在 另 一 个 属于 有 8 的 对 相同 名 字 * 的 声明 D'。 

另 一 个 等 价 的 表达 这 个 规则 的 方法 着 眼 于 名 字 * 的 一 次 使 用 。 设 外 ，B。 ,，…， 有 8 是 所 有 的 
包含 了 x 的 该 次 使 用 的 块 。 其 中 , Bi REE Bit, By, REE B tP, e, 依 此 类 推 。 寻 找 
最 大 的 满足 下 面条 件 的 i: 存在 一 个 属于 B; 的 x 的 声明 。 本 次 对 x 的 使 用 就 是 指向 B, 中 对 x 的 声 
明 。 换 句 话 说 , x 的 本 次 使 用 在 B, 中 的 这 个 声明 的 作用 域内 。 

ORG 在 图 1-10 中 的 C++ 程 序 有 四 个 块 , 其 中 包含 了 变量 a 和 4 的 几 个 定义 。 为 了 帮助 记 
忆 , 每 个 声明 把 其 变量 初始 化 为 它 i 
所 属于 的 那个 块 的 编号 。 main() { 
























































比如 , 考虑 块 Bi 中 的 声明 int a=1。 [Rely B, | 
它 的 作用 域 包括 整个 B ,当然 那 些 ( 可 能 很 |{ 一 
PRs) WE B 中 并 且 有 它 自 己 的 对 a 的 Cd nPE 
EMRK BERRET B, 中 的 B, 没 Eoo TE 
A a 的 声明 ， 而 53 就 有 。 B4 KA a 的 声 i | 
明 。 因 此 块 By 是 整个 程序 中 唯一 位 于 名 字 cass T) | 
a TE By 中 的 声明 的 作用 域 之 外 的 地 方 。 也 
就 是 说 ,这 个 作用 域 包括 B, MB 中 除了 cout << a << b; 
By 之 外 的 所 有 部 分 。 关 于 程序 中 的 全 部 五 。 lou a< b; 
个 声明 的 作用 域 的 总 结 见 图 1-11。 } 

从 另 一 个 角度 看 ， 让 我 们 考虑 块 B4 中 E110 40 ++ ARH 
的 输出 语句 , 并 把 那里 使 用 的 变量 a 和 4 和 = ern 
适当 的 声明 绑 定 。 包 含 该 语句 的 块 的 列表 er 
从 小 到 大 是 By, By. Bio WER, By 没有 aie ae 
包含 问题 中 所 提 到 的 点 。B4 有 一 个 5 的 声 eee DER 
明 , 因此 该 语句 中 对 的 使 用 被 绑 定 到 这 个 ss B, 
声明 , 因此 打印 出 来 的 5 的 值 是 4。 然 而 ， int b=4; B, 
B, 没有 a 的 声明 ,因此 我 们 接着 看 B 。 这 
个 块 也 没有 a 的 声明 ,因此 我 们 继续 看 Bi。 a a A 
幸运 的 是 , 这 个 块 有 一 个 声明 inta = 1。 因 此 , 打印 出 来 的 e 的 值 是 1。 如 果 没 有 这 个 声明 ， 
程序 就 是 错误 的 。 口 


1.6.4 显 式 访问 控制 
类 和 和 结构 为 它们 的 成 员 引 入 了 新 的 作用 域 。 如 果 p 是 一 个 具有 字段 (成 员 )x 的 类 的 对 象 , 那 
LE p. x 中 对 x 的 使 用 指 的 是 这 个 类 定义 中 的 字段 <。 和 块 结构 类 似 , 类 C 中 的 一 个 成 员 声 明 x 





的 作用 域 可 以 扩展 到 所 有 的 子 类 C, 除非 C' 有 一 个 本 地 的 对 同一 名 字 x 的 声明 。 
通过 public, private 和 protected 这 样 的 关键 字 的 使 用 , 像 C++ 或 Java 这 样 的 面向 对 象 语言 
提供 了 对 超 类 中 的 成 员 名 字 的 显 式 访 问 控制 。 这 些 关 键 字 通 过 限制 访问 来 支持 封装 (eneapsuja- 


(C++ 的 术语 ) 相关 的 方法 声明 和 定义 。 被 保护 的 (protected ) 名 字 可 以 由 子 类 访问 ， 而 公共 的 
(public) 名 字 可 以 从 类 外 访问 。 

在 C++ 中, 一 个 类 的 定义 可 能 和 它 的 部 分 或 全 部 方法 的 定义 分 离 。 因 此 对 于 一 个 和 类 C 相 
关联 的 名 字 *, 可 能 存在 一 个 在 它 作 用 域 之 外 的 代码 区 域 , 然后 又 跟着 一 个 在 它 作用 域内 的 代码 
区 域 (一 个 方法 定义 )。 实 际 上 , 在 这 个 作用 域 之 内 和 之 外 的 代码 区 域 可 能 相互 交替 ,直到 所 有 
的 方法 都 被 定义 完毕 。 








声明 和 定义 

程序 设计 语言 概念 中 的 两 个 看 起 来 相似 的 术语 “声明 ”和 "定义 "实际 上 有 着 很 大 的 不 同 。 声 
明 告 诉 我 们 事物 的 类 型 ， 而 定义 告诉 我 们 它们 的 值 。 因 此 ,int i 是 一 个 i 的 声明 , 而 i =1 是 i 
的 一 个 定义 ( 定 值 ) 。 

当 我 们 处 理 方法 或 者 其 他 过 程 时 , 这 个 区 别 就 更 加 明显 。 在 C++ 中 , 通过 给 出 了 方法 
的 参数 及 结果 的 类 型 (通常 称 为 该 方法 的 范 型 ), 在 类 的 定义 中 声明 这 个 方法 。 然 后 ,这 个 
方法 在 另 一 个 地 方 被 定义 , 即 在 另 一 个 地 方 给 出 了 执行 这 个 方法 的 代码 。 类 似 地 ,我 们 会 经 
常 看 到 在 一 个 文件 中 定义 了 一 个 C 语言 的 函数 ,然后 在 其 他 使 用 这 个 函数 的 文件 中 声明 这 
个 函数 。 








1.6.5 动态 作用 域 

从 技术 上 讲 , 如 果 一 个 作用 域 策略 依赖 于 一 个 或 多 个 只 有 在 程序 执行 时 刻 才能 知道 的 因素 ， 
它 就 是 动态 的 。 然 而 , 术语 动态 作用 域 通 常 指 的 是 下 面 的 策略 : 对 一 个 名 字 * 的 使 用 指向 的 是 最 
近 被 调用 但 还 没有 终止 且 声 明了 % 的 过 程 中 的 这 个 声明 。 这 种 类 型 的 动态 作用 域 仅仅 在 一 些 特 
殊 情 况 下 才 会 出 现 。 我 们 将 考虑 两 个 动态 作用 域 的 例子 ; C 预 处 理 器 中 的 宏 扩 展 , 以 及 面向 对 象 
编程 中 的 方法 解析 。 
在 图 1-12 给 出 的 C 程序 中 , 标识 符 a 是 一 个 代表 了 表达 式 (x +1) 的 宏 。 但 到 底 是 什 
AR? 我 们 不 能 够 静态 地 ( 也 就 是 说 通过 程序 文本 ) 解 析 x。 

实际 上 , 为 了 解析 x, 我 们 必须 使 用 前 面 提 
到 的 普通 的 动态 作用 域 规则 。 我 们 检查 所 有 当 
前 活跃 的 函数 调用 ， 然 后 选择 最 近 调用 的 且 具 
有 一 个 对 x 的 声明 的 函数 S。 对 * 的 使 用 就 是 指 
向 这 个 声明 。 

在 图 1-12 的 例子 中 , 函数 main 首先 调用 函 一 
数 5。 当 6 执行 时 打印 宏 a 的 值 。 因 为 首先 必须 图 1-12 一 个 其 名 字 的 作用 域 必须 动态 确定 的 宏 





#define a (x+1) 

int x = 2; 

void b() { int x = 1; printf ("/d\n", a); } 
void c() { printf£("%d\n", a); } 

void main() { bO; cO; } 














O 这 个 规则 可 能 只 对 当前 的 例子 成 立 。 如 果 将 图 1-12 WBT P HKR b BK void b() (int x =1; printf 
("s am a); c0; ), BAY main MRA BAH), 函数 又 调用 < 的 时 候 , c HAI printf ("s d\n", a) 语 句 
依然 打印 值 2。 即 此 时 对 x 的 使 用 对 应 的 仍然 是 全 局 的 x， 而 不 是 按照 规则 确定 的 函数 ， 即 “最 近 调 用 的 且 有 一 
个 对 x 的 声明 的 函数 " 。 译 者 注 
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用 (x+1) 替 换 掉 a, 所 以 我 们 把 本 次 对 x 的 使 用 解析 为 对 函数 5 中 的 声明 int x =1。 原 因 是 5 有 
一 个 x 的 声明 , 因此 5 中 的 printf 中 的 (x+1) 指 向 这 个 x。 因 此 , 打印 出 的 值 是 2。 

TE b 运行 结束 之 后 ,函数 被 调用 , 我 们 依旧 需要 打印 宏 的 值 。 然 而 ,唯一 可 以 被 访问 
的 x 是 全 局 变量 x, Me 中 的 printf 请 名 指向 x 的 这 个 声明 , 且 被 打印 的 值 是 3。 口 

动态 作用 域 解析 对 多 态 过 程 是 必 不 可 少 的 。 所 谓 多 态 过 程 是 指 对 于 同一 个 名 字 根 据 参数 
类 型 具有 两 个 或 多 个 定义 的 过 程 。 在 有 些 语言 中 , 比如 ML( 见 7.3.3 节 )， 人 们 可 以 静态 地 确 
定名 字 所 有 使 用 的 类 型 。 在 这 种 情况 下 , 编译 器 可 以 把 每 个 名 字 为 p 的 过 程 奉 换 为 对 相应 的 
过 程 代码 的 引用 。 但 是 , 在 其 他 语言 中 ,比如 在 Java 和 C ++ 中, 编译 器 有 时 不 能 够 做 出 这 样 
的 决定 。 





静态 作用 域 和 动态 作用 域 的 类 比 
虽然 可 以 有 各 种 各 样 的 静态 或 者 动态 作用 域 策 略 , 在 通常 的 ( 块 结构 的 ) 静 态 作用 域 规则 
和 通常 的 动态 策略 之 间 有 一 个 有 趣 的 关系 。 从 某 种 意义 上 说 , 动态 规则 处 理 时 间 的 方式 类 似 
于 静态 作用 域 处 理 空间 的 方式 。 静 态 规 则 让 我 们 寻找 的 声明 位 于 最 内 层 的 、 包 含 变 量 使 用 位 
置 的 单元 ( 块 ) 中 ; 而 动态 规则 让 我 们 寻找 的 声明 位 于 最 内 层 的 、 包含 了 变量 使 用 时 间 的 单元 
(过 程 调用 ) 中 。 











面向 对 象 语言 的 一 个 突出 特征 就 是 每 个 对 象 能 够 对 一 个 消息 做 出 适当 反应 , 调用 相应 
的 方法 。 换 名 话说 , 执行 x. m( ) 时 调用 哪个 过 程 要 由 当时 x 所 指 癌 的 对 象 的 类 来 决定 。 一 个 典型 
的 例子 如 下 : 

1) 有 一 个 类 C, 它 有 一 个 名 字 为 m( ) 的 方法 。 

2) D 是 C 的 一 个 子 类 , 而 了 DD 有 一 个 它 自己 的 名 字 为 m( ) 的 方法 。 

3) 有 一 个 形 如 zx. m( ) 的 对 xx 的 使 用 , 其 中 zx 是 类 C 的 一 个 对 象 。 

正常 情况 下 , 在 编译 时 刻 不 可 能 指出 x 指向 的 是 类 C 的 对 象 还 是 其 子 类 D 的 对 象 。 如 果 这 
个 方法 被 多 次 应 用 , 那么 很 可 能 某 些 调用 作用 在 由 * 指向 的 类 C 的 对 象 , 而 不 是 类 D 的 对 象 , 而 
其 他 调用 作用 于 类 D 的 对 象 之 上 。 只 有 到 了 运行 时 刻 才 可 能 决定 应 当 调 用 m 的 哪个 定义 。 
此 ,编译 器 生成 的 代码 必须 决定 对 象 * HX, 并 调用 其 中 的 某 一 个 名 字 为 m 的 方法 。 口 
1.6.6 参数 传递 机 制 

所 有 的 程序 设计 语言 都 有 关于 过 程 的 概念 , 但 是 在 这 些 过 程 如 何 获取 它们 的 参数 方面 , 不 同 
的 语言 之 间 有 所 不 同 。 在 本 节 , 我 们 将 考虑 实在 参数 (在 调用 过 程 时 使 用 的 参数 ) 是 如 何 与 形式 
参数 (在 过 程 定义 中 使 用 的 参数 ) 关联 起 来 的 。 使 用 哪 一 种 传递 机 制 决定 了 调用 代码 序列 如 何 处 
理 参数 。 大 多 数 语言 要 么 使 用 “ 值 调 用 ”, 要 么 使 用 “引用 调用 ”, 或 者 两 者 都 用 。 我 们 将 解释 这 
些 术 语 以 及 男 一 个 被 称 为 “名 调用 ”的 方法 , 解释 后 者 主要 是 基于 对 历史 的 兴趣 。 

值 调用 

在 值 调用 (call-by-value) 中 , 会 对 实在 参数 求 值 ( 如 果 它 是 表达 式 ) 或 拷贝 (如 果 它 是 变量 )。 
这 些 值 被 放 在 属于 被 调用 过 程 的 相应 形式 参数 的 内 存 位 置 上 。 这 种 方法 在 C 和 Java 中 使 用 , 也 
是 C++ 语言 及 大 部 分 其 他 语言 的 一 个 常用 选项 。 值 调用 的 效果 是 , 被 调用 过 程 所 做 的 所 有 有 关 
形式 参数 的 计算 都 局 限于 这 个 过 程 , 相应 的 实在 参数 本 身 不 会 被 改变 。 

然而 请 注意 , 在 C 语言 中 我 们 可 以 传递 变量 的 一 个 指针 , 使 得 该 变量 的 值 能 够 被 被 调用 
者 修改 。 同 样 ,， C、C ++ 和 Java 中 作为 参数 传递 的 数组 名 字 实 际 上 向 被 调用 过 程 传递 了 一 个 
指向 该 数组 本 身 的 指针 或 引用 。 因 此 , 如果 a 是 调用 过 程 的 一 个 数组 的 名 字 , 且 它 被 以 值 调用 
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的 方式 传递 给 相应 的 形式 参数 x, MAAR x[21 =i 这 样 的 赋值 语句 实际 上 改变 了 数组 元 尝 ali). 
原因 是 虽然 x 是 a 的 值 的 一 个 拷贝 ,但 这 个 值 实际 上 是 一 个 指针 , 指向 被 分 配给 数组 a 的 存储 区 
域 的 开始 处 。 

类 似 地 ，Java 中 的 很 多 变量 实际 上 是 对 它们 所 代表 的 事物 的 引用 , 或 者 说 指针 。 这 个 结论 对 
数组 、 字符 串 和 所 有 类 的 对 象 都 有 效 。 虽 然 Java 只 使 用 值 调用 , 但 只 要 我 们 把 一 个 对 象 的 名 字 传 
递 给 一 个 被 调用 过 程 , 那个 过 程 收 到 的 值 实际 上 是 这 个 对 象 的 指针 。 因 此 , 被 调用 过 程 是 可 以 改 
变 这 个 对 象 本 身 的 值 的 。 

引用 调用 

在 引用 调用 (call-by-reference) 中 ,实在 参数 的 地 址 作为 相应 的 形式 参数 的 值 被 传递 给 被 调用 
者 。 在 被 调用 者 的 代码 中 使 用 形式 参数 时 ,实现 方法 是 沿 着 这 个 指针 找到 调用 者 指明 的 内 存 位 
置 。 因 此 , 改变 形式 参数 看 起 来 就 像 是 改变 了 实在 参数 一 样 。 

BÆ, 如 果实 在 参数 是 一 个 表达 式 , 那么 在 调用 之 前 首先 会 对 表达 式 求 值 , 然后 它 的 值 被 
存放 在 一 个 该 值 自 己 的 位 置 上 。 改 变形 式 参 数 会 改变 这 个 位 置 上 的 值 , 但 对 调用 者 的 数据 没 
有 影响 。 

C++ 中 的 "ref "参数 使 用 的 是 引用 调用 。 而 在 很 多 其 他 语言 中 , 引用 调用 也 是 一 种 选项 。 当 
形式 参数 是 一 个 大 型 的 对 象 、 数 组 或 结构 时 , 引用 调用 几乎 是 必 不 可 少 的 。 原 因 是 严格 的 值 调用 
要 求 调 用 者 把 整个 实在 参数 拷贝 到 属于 相应 形式 参数 的 空间 上 。 当 参数 很 大 时 , 这 种 拷贝 可 能 
代价 高 昂 。 正 如 我 们 在 讨论 值 调用 时 所 指出 的 , 像 Java 这 样 的 语言 解决 数组 、 字 符 串 和 其 他 对 象 
的 参数 传递 问题 的 方法 是 仅仅 复制 这 些 对 象 的 引用 。 结 果 是 , Java 运行 时 就 好 像 它 对 所 有 不 是 基 
本 类 型 ( 比如 整数 、 实 数 等 ) 的 参数 都 使 用 了 引用 调用 。 

名 调用 

第 三 种 机 制 一 一 名 调用 一 一 被 早期 的 程序 设计 语言 Algol 60 使 用 。 它 要 求 被 调用 者 的 运行 
方式 好 像 是 用 实在 参数 以 字面 方式 替换 了 被 调用 者 的 代码 中 的 形式 参数 一 样 。 这 么 做 就 好 像 形 
式 参 数 是 一 个 代表 了 实在 参数 的 宏 。 当 然 被 调用 过 程 的 局 部 名 字 需 要 进行 重 命名 , 以便 把 它们 
和 调用 者 中 的 名 字 区 别 开 来 。 当 实在 参数 是 一 个 表达 式 而 不 是 一 个 变量 时 , 会 发 生 一 些 和 直觉 
不 符 的 问题 。 这 也 是 今天 不 再 采用 这 种 机 制 的 原因 之 一 。 

1.6.7 别名 

引用 调用 或 者 其 他 类 似 的 方法 ,比如 像 Java 中 那样 把 对 象 的 引用 当 作 值 传递 , 会 引起 一 个 有 
趣 的 结果 。 有 可 能 两 个 形式 参数 指向 同一 个 位 置 , 这 样 的 变量 称 为 另 一 个 变量 的 别名 (ajias ) 。 
结果 是 , 任意 两 个 看 起 来 从 两 个 不 同 的 形式 参数 中 获得 值 的 变量 也 可 能 变 成 对 方 的 别名 。 
ADER 假设 a 是 一 个 属于 某 个 过 程 p 的 数组 , B p 通过 调用 语句 g(a, a) 调 用 了 另 一 个 过 程 
g(x, Y)。 再 假设 像 C 语言 或 类 似 的 语言 那样 , 参数 是 通过 值 传递 的 , 但 数组 名 实际 上 是 指向 数 
组 存放 位 置 的 引用 。 现 在 , x My 变 成 了 对 方 的 别名 。 要 点 在 于 ,如 果 9 中 有 一 个 赋值 语句 
x[10] =2, 那么 y[10] 的 值 也 是 2。 

事实 上 ,如 果 编 译 器 要 优化 一 个 程序 ， 就 要 理解 别名 现象 以 及 产生 这 一 现象 的 机 制 。 正 如 我 
们 从 第 9 章 看 到 的 , 在 很 多 情况 下 我 们 必须 在 确认 某 些 变量 相互 之 间 不 是 别名 之 后 才 可 以 优化 程 
序 。 比 如 , 我 们 可 能 确定 x =2 是 变量 x 唯一 被 赋值 的 地 方 。 如 果 是 这 样 ,那么 我 们 可 以 把 对 x 
的 使 用 替换 为 对 2 的 使 用 。 比 如 , 把 a =x +3 替换 为 较 简单 的 a =5。 但 是 , 假设 有 另 一 个 变量 
是 x 的 别名 。 那 么 , 一 个 赋值 语句 y = 4 可 能 具有 意 想不到 的 改变 x 的 值 的 效果 。 这 可 能 也 意味 
着 把 a =x+3 替换 为 a =5 是 一 个 错误 , 此 时 , a 的 正确 值 可 能 是 7。 
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1.6.8 


1. 6 节 的 练习 























练习 1. 6.1: 对 图 1-13a 中 的 块 结构 的 C 代码 , FERIRE w, x, y 和 z 的 值 。 
int w, X, y, Z; int w, X, y, Z; 
int i = 4; int j = 5; int i = 3; int j = 4; 
{ int j = 7; { int i = 5; 
i= 6; w=i+j 
w=i+j } 
} x =i+t+j; 
x= itj; { int j = 6; 
{ int i= 8; i=7; 
y=i+j; SL OG 
} } eee vs 
Zeit j Z=i1itj 
a) 练习 1.6.1 的 代码 b) 练习 1.6.2 的 代码 


练习 1.6.2: 对 图 1-13b 中 的 代码 重复 练习 1.6. 1。 


图 1-13 ” 块 结构 代码 














| /* k Bi */ 
练习 1. 6. 3: 对 于 图 1-14 中 的 块 结构 代码 ,假设 使 人 
用 常见 的 声明 的 静态 作用 域 规则 ,给 出 其 中 12 个 声明 | | f amt 3 RBS D 
中 的 每 一 个 的 作用 域 。 { int w, x; /* 块 B4 */ 
练习 1.6.4: 下 面 的 C 代码 的 打印 结果 是 什么 ? 人 
”jaefine a (x+1) } 
int x = 2; 
void bO) { x = a; printf("4d\n", x); } 图 1-14 练习 1.6.3 的 块 结构 代码 


void c() { int x = 1; printf("/d\n", a); } 
void main() { bO; cO; } 


1.7 第 1 章 总 结 


语言 处 理 器 : 一 个 集成 的 软件 开发 环境 ,其 中 包括 很 多 种 类 的 语言 处 理 器 ， 比 如 编译 器 、 
解释 器 、 汇 编 器 、 连 接 器 、 加 载 器 、 调 试 器 以 及 程序 概要 提取 工具 。 

编译 器 的 步骤 : 一 个 编译 器 的 运作 需要 一 系列 的 步 又, 每 个 步骤 把 源 程序 从 一 个 中 间 表 
示 转 换 成 为 男 一 个 中 间 表 示 。 

机 器 语言 和 汇编 语言 : 机 器 语言 是 第 一 代 程 序 设计 语言 , 然后 是 汇编 语言 。 使 用 这 些 语 
言 进行 编程 既 费 时 ， 又 容易 出 错 。 l 

编译 器 设计 中 的 建 模 ; 编译 器 设计 是 理论 对 实践 有 很 大 影响 的 领域 之 一 。 已 知 在 编译 器 
设计 中 有 用 的 模型 包括 自动 机 、 文 法 、 正 则 表达 式 、 树 型 结构 和 很 多 其 他 理论 概念 。 

代码 优化 : 虽然 代码 不 能 真正 达到 最 优化 , 但 提高 代码 效率 的 科学 既 复 杂 又 非常 重要 。 
它 是 编译 技术 研究 的 一 个 主要 部 分 。 

高 级 语言 : 随 着 时 间 的 流逝 , 程序 设计 语言 担负 了 越 来 越 多 的 原先 由 程序 员 负 责 的 任务 ， 
比如 内 存 管理 、 类 型 一 致 性 检查 或 代码 的 并 发 执行 。 

编译 器 和 计算 机 体系 结构 : 编译 器 技术 影响 了 计算 机 的 体系 结构 ,同时 也 受到 体系 结构 
发 展 的 影响 。 体 系 结构 中 的 很 多 现代 创新 都 依赖 于 编译 器 能 够 从 源 程序 中 抽取 出 有 效 利 
用 硬件 能 力 的 机 会 。 

软件 生产 率 和 软件 安全 性 : 使 得 编译 器 能 够 优化 代码 的 技术 同样 能 够 用 于 多 种 不 同 的 程 
序 分 析 任 务 。 这 些 任 务 既 包括 探测 常见 的 程序 错误 ,也 包括 发 现 程序 可 能 会 受到 已 被 黑 
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客 们 发 现 的 多 种 人 侵 方 式 之 一 的 伤害 。 

o 作用 域 规则 : 一 个 * 的 声明 的 作用 域 是 一 段 上 下 文 , 在 此 上 下 文中 对 x 的 使 用 指向 这 个 声 
明 。 如 果 仅 仅 通 过 阅读 某 个 语言 的 程序 就 可 以 确定 其 作用 域 , DRAG BS AT 
态 作 用 域 , 或 者 说 词法 作用 域 。 否则 这 个 语言 就 使 用 了 动态 作用 域 。 

e 环境 : 名 字 和 内 存 位 置 关 联 , 然后 再 和 值 相 关联 。 这 个 情况 可 以 使 用 环境 和 状态 来 描述 。 
其 中 环境 把 名 字 映 射 成 为 存储 位 置 , 而 状态 则 把 位 置 映射 到 它 的 值 。 

o 块 结构 : 允许 语句 块 相互 柑 套 的 语言 称 为 块 结构 的 语言 。 假 设 一 个 块 中 有 一 个 x 的 声明 
D, 而 构 大 于 这 个 块 中 的 块 B 中 有 一 个 对 名 字 x 的 使 用 。 如 果 在 这 两 个 块 之 间 没 有 其 他 声 
BAY «AR, 那么 这 个 的 使 用 位 于 了 D 的 作用 域内 。 

e 参数 传递 : 参数 可 以 通过 值 或 引用 的 方式 从 调用 过 程 传递 给 被 调用 过 程 。 当 通过 值 传递 
方式 传递 大 型 对 象 时 , 实际 被 传递 的 值 是 指向 这 些 对 象 本 身 的 引用 。 这 样 就 变 成 了 一 个 
高 效 的 引用 调用 。 

e 别名 : 当 参 数 被 以 引用 传递 方式 ( 高效 地 ) 传 递 时 ， 两 个 形式 参数 可 能 会 指向 同一 个 对 象 。 
这 会 造成 一 个 变量 的 修改 改变 了 另 一 个 变量 的 值 。 


1.8 第 1 章 参考 文献 


对 于 在 1967 年 之 前 被 开发 并 使 用 的 程序 设计 语言 (包括 Fortran, Algol, Lisp 和 Simula) 的 发 
展 历程 见 [7] 。 对 于 1982 年 前 被 创建 的 语言 (包括 C、C ++ 、Pascal 和 Smalltalk) 见 [1] 。 

GNU 编译 器 集合 gcc (GNU Compiler Collection) Æ C, C ++ 、Fortran、Java 和 其 他 语言 的 开源 
编译 器 的 流行 源头 [2] 。Phoenix 是 一 个 编译 器 构造 工具 包 , 它 提供 了 一 个 集成 的 框架 , 用 于 建立 
本 书 中 提 到 的 编译 器 的 程序 分 析 、 代 码 生成 和 代码 优化 步骤 [3 ] 。 

要 获取 更 多 的 关于 程序 设计 语言 概念 的 信息 , 我 们 推荐 [5, 6]。 要 知道 更 多 的 关于 计算 机 体 
系 结构 信息 , 以 及 体系 结构 是 如 何 影 响 编译 的 , 我 们 建议 阅读 [4] 。 
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第 2 章 一 个 简单 的 语法 制导 翻译 器 


本 章 的 内 容 是 对 本 书 第 3 章 至 第 6 章 中 介绍 的 编译 技术 的 总 体 介 绍 。 通 过 开发 一 个 可 运行 
的 Java 程序 来 演示 这 些 编译 技术 。 这 个 程序 可 以 将 具有 代表 性 的 程序 设计 语言 语句 翻译 为 三 地 
址 代码 (一 种 中 间 表 示 形 式 ) 。 本 章 的 重点 是 编译 器 的 前 端 , 特别 是 词法 分 析 、 语 法 分 析 和 中 间 
代码 生成 。 在 第 7 章 和 第 8 章 将 介绍 如 何 根据 三 地 址 代码 生成 机 器 指令 。 

我 们 从 小 事 做 起 , 首先 建立 一 个 能 够 将 中 缀 算术 表达 式 转 换 为 后 缀 表达 式 的 语法 制导 翻译 
器 。 然 后 我 们 将 扩展 这 个 翻译 器, 使 它 能 将 某 些 程序 片段 (如 图 2-1 所 示 ) 转 换 为 如 图 22 所 示 的 
三 地 址 代码 。 





{ 
int i; int j; float[100} a; float v; float x; 
while ( true ) { 
do i = it1; while ( afi] < v ); 
do j = j-1; while ( a[j] > v ); 
if ( i >= j ) break; 
x = a[i]; ali] = a[j]; alj] = x; 
} 
} 





图 2-1 一 个 将 被 翻译 的 代码 片段 
这 个 可 运行 的 Java 程序 见 附录 A。 使 用 Java 比较 方便 , 但 并 非 必须 用 Java。 实 际 上 , 本 章 中 








goto 14 


码 。 然 后 , 编译 器 在 合成 阶段 将 这 个 中 间 代 码 翻 译 成 目标 peH 
程序 。 10; t3=a[j] 

分 析 阶 段 的 工作 是 围绕 着 待 编译 语言 的 “语法 "展开 的 。 | TM anir 
一 个 程序 设计 语言 的 语法 (syntax) 描述 了 该 语言 的 程序 的 正 | 13: goto 1 
确 形式 , 而 该 语言 的 语义 (semantics) 则 定义 了 程序 的 含义 , 即 LIE | 
每 个 程序 在 运行 时 做 什么 事情 。 我 们 将 在 2. 2 节 中 给 出 一 个 图 2.2 与 图 2.1 中 程序 片段 对 应 的 
广 范 使 用 的 表示 方法 来 描述 语法 ， 这 个 方法 就 是 上 下 文 无 关 经 过 简化 的 中 间 代 码 表示 
文法 或 BNF( Backus-Naur 范式 ) 。 使 用 现 有 的 语义 表示 方法 来 
描述 一 个 语言 的 语义 的 难度 远 远 大 于 描述 语言 的 语法 的 难度 。 因 此 , 我 们 将 结合 非 形式 化 描述 
和 启发 性 的 示例 来 描述 语言 的 语义 。 

上 下 文 无 关 文 法 不 仅 可 以 描述 一 个 语言 的 语法 , 还 可 以 指导 程序 的 翻译 过 程 。 在 2 3 节 中 ， 
我 们 将 介绍 一 种 面向 文法 的 编译 技术 , 即 语法 制导 翻译 ( syntax-directed translation) 技术 。 语 法 扫 
W, 或 者 说 语法 分 析 , 将 在 2.4 节 中 介绍 。 


描述 的 思想 在 Java 和 C 语言 出 现 之 前 就 存在 了 o 
l: i=i+1 
LR, 2: by a | 
2. 1 5| A 3: a t1 < v goto 1 
4 j=j-1 
编译 器 在 分 析 阶 段 把 一 个 源 程序 划分 成 各 个 组 成 部 分 ， 5: t2=a[j] 
并 生成 源 程序 的 内 部 表示 形式 。 这 种 内 部 表示 称 为 中 间 代 | f irase 了 到 goto 9 
8: 
9: 
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本 章 的 其 余部 分 将 快速 浏览 一 下 图 2-3 所 示 的 编译 器 前 端 模型 。 我 们 将 首先 介绍 语法 分 析 
器 。 为 简单 起 见 , 我 们 首先 考虑 从 中 缀 表达 式 到 后 级 表达 式 的 语法 制导 翻译 过 程 。 后 级 表达 式 
是 一 种 将 运算 符 置 于 运算 分 量 之 后 的 表示 方法 。 例 如 , 表达 式 9 -5+2 的 后 统 形 式 是 95 - 2+。 
将 表达 式 翻 译 为 后 绥 形 式 的 过 程 可 以 充分 演示 语法 分 析 技 术 , 同时 这 个 翻译 过 程 又 很 简单 ,我们 
将 在 2.5 节 中 给 出 这 个 翻译 器 的 全 部 程序 。 这 个 简单 的 翻译 器 处 理 的 表达 式 是 由 加 、 减 号 分 隔 的 
数位 序列 ， 如 9 -5+2。 我 们 之 所 以 先 考虑 这 样 的 简单 表达 式 ,主要 目的 是 简化 这 个 语法 分 析 器 ， 
使 得 它 在 处 理 运 算 分 量 和 运算 符 时 只 需要 考虑 单个 字符 。 

















源 程序 - 词法 单元 语法 分 析 树 | 中 间 代 码 


生成 器 


三 地 址 代码 









词法 分 析 器 语法 分 析 器 








图 2-3 一 个 编译 器 前 端的 模型 


词法 分 析 器 使 得 翻译 器 可 以 处 理由 多 个 字符 组 成 的 构造 ， 比 如 标识 符 。 标 识 符 由 多 个 字符 
组 成 , 但 是 在 语法 分 析 阶 段 被 当 作 一 个 单元 进行 处 理 。 这 样 的 单元 称 作词 法 单元 (token) 。 例 如 ， 
在 表达 式 count +1 中 , 标识 符 count 被 当 作 一 个 单元 。2.6 节 中 介绍 的 词法 分 析 器 允许 表达 式 中 


出 现 数值 、 标 识 符 和 “空白 字符 "(空格 、 do-while 
制 表 符 和 换行 符 ) 。 a 

接 下 来 我 们 考虑 中 间 代 码 的 生成 。 | ZN 
在 图 2-4 中 显示 了 两 种 中 间 代 码 形式 。 一 D Be Y WE 
种 称 为 抽象 语法 树 (abstract syntax tree), ; ” i ; % tisalil 
或 简称 为 语法 树 (syntax tee)。 它 表示 了  / N 3 if t1 < v goto 1 
源 程序 的 层次 化 语法 结构 。 在 图 23 的 模 


型 中 , 语法 分 析 器 生成 一 棵 语法 树 , 它 又 
被 进一步 翻译 为 三 地 址 代码 。 有 些 编译 Q 图 ?4 “do i-i+ds while(ali] <v)” 的 中 间 代 码 
器 会 将 语法 分 析 和 中 间 代码 生成 合并 为 一 个 组 件 。 

图 2-4a 中 的 抽象 语法 树 的 根 表示 整个 do-while 循环 。 根 的 左 子 树 表示 循环 的 循环 体 , 它 仅 
包含 赋值 语句 i=i+1;, 根 的 右 子 树 表示 循环 控制 条 件 afi] <vo 在 2.8 节 中 将 介绍 一 个 构造 语 
法 树 的 方法 。 

图 2-4b 中 给 出 了 另 一 种 常见 的 中 间 表 示 形式 , 它 是 一 组 “三 地 址 ”指令 序列 , 图 2.2 中 显示 
了 一 个 更 加 完整 的 示例 。 这 个 中 间 代码 形式 的 名 字源 于 它 的 指令 形式 : x =y op z, 其 中 op 是 一 
个 二 目 运算 符 , y 和 z 是 运算 分 量 的 地 址 , x 是 运算 结果 的 存放 地 址 。 三 地 址 指令 最 多 只 执行 一 
个 运算 , 通常 是 计算 、 比 较 或 者 分 支 跳 转运 算 。 

在 附录 A 中 , 我 们 将 把 本 章 中 的 技术 集成 在 一 起 , 构造 出 一 个 用 Java 语言 编写 的 编译 器 前 
端 。 这 个 前 端 将 语句 翻译 成 汇编 级 的 指令 序列 。 


2.2 语法 定义 


在 这 一 节 , 我 们 将 介绍 一 种 用 于 描述 程序 设计 语言 语法 的 表示 方法 一 一 "上 下 文 无 关 文法 ”， 
或 简称 “文法 ”。 在 本 书 中 , 文法 将 被 用 于 组 织 编译 器 前 端 。 








文法 自然 地 描述 了 大 多 数 程序 设计 语言 构造 的 层次 化 语法 结构 。 例 如 , Java 中 的 if-else 语句 
通常 具有 如 下 形式 
if (expression) statement else statement 
即 一 个 if-else 语句 由 关键 字 让 、 左 括号 、 表 达 式 、 右 括号 、 一 个 语句 、 KEF else 和 另 一 个 语句 连 
接 而 成 。 如 果 我 们 用 变量 expr 来 表示 表达 式 ， 用 变量 stmt 表示 语句 , 那么 这 个 构造 规则 可 以 表 
示 为 

simi— if ( expr ) stmt else stmt 

其 中 的 箭头 (一 ) 可 以 读 作 “可 以 具有 如 下 形式 ”。 这 样 的 规则 称 为 产生 式 (production)。 在 一 个 产 
ERT, 像 关 键 字 if 和 括号 这 样 的 词法 元 素 称 为 终结 符号 (terminal) 。 像 expr 和 simi 这 样 的 变量 
表示 终结 符号 的 序列 , 它们 称 为 非 终结 符号 (nonterminal) 。 
2.2.1 文法 定义 

一 个 上 下 文 无 关 文 法 (context-free grammar) H MATR HAR: 

1) 一 个 终结 符号 集合 , 它们 有 时 也 称 为 “词法 单元 " 。 终 结 符 号 是 该 文法 所 定义 的 语言 的 基 
本 符号 的 集合 。 

2) 一 个 非 终结 符号 集合 , 它们 有 时 也 称 为 "语法 变量 " 。 每 个 非 终 结 符号 表示 一 个 终结 符号 
串 的 集合 。 我 们 将 在 后 面 介 绍 这 种 表示 方法 。 

3) 一 个 产生 式 集合 ,其 中 每 个 产生 式 包括 一 个 称 为 产生 式 头 或 堪 部 的 非 终结 符号 ,一 个 箭 
头 ， 和 一 个 称 为 产生 式 体 或 右 部 的 由 终结 符号 及 非 终 结 符号 组 成 的 序列 。 产 生 式 主要 用 来 表示 
某 个 构造 的 某 种 书写 形式 。 如 果 产 生 式 头 非 终 结 符 号 代表 一 个 构造 ,那么 该 产生 式 体 就 代表 了 
该 构造 的 一 种 书写 方式 。 

4) 指定 一 个 非 终结 符号 为 开始 符号 。 





词法 单元 和 终结 符号 
在 编译 器 中 , 词法 分 析 器 读 人 源 程 序 中 的 字符 序列 , 将 它们 组 织 为 具有 词法 含义 的 词素 ， 
生成 并 输出 代表 这 些 词素 的 词法 单元 序列 。 词 法 单元 由 两 个 部 分 组 成 : 名 字 和 属性 值 。 词 法 
单元 的 名 字 是 语法 分 析 器 进行 语法 分 析 时 使 用 的 抽象 符号 。 我 们 常常 把 这 些 词 法 单元 名 字 称 
为 终结 符号 , 因为 它们 在 描述 程序 设计 语言 的 文法 中 是 以 终结 符号 的 形式 出 现 的 。 如 果 词 法 
单元 具有 属性 值 , 那么 这 个 值 就 是 一 个 指向 符号 表 的 指针 , 符号 表 中 包含 了 该 词法 单元 的 附 
加 信息 。 这 些 附加 信息 不 是 文法 的 组 成 部 分 , 因此 在 我 们 讨论 语法 分 析 时 , 通常 将 词法 单元 
和 终结 符号 当做 同义词 。 








在 描述 文法 的 时 候 , 我 们 会 列 出 该 文法 的 产生 式 , 并 且 首 先 列 出 开始 符号 对 应 的 产生 式 。 我 
们 假设 数位 、 符 号 (如 < 、<= ) 和 黑体 字符 串 (如 while) 都 是 终结 符号 。 斜 体 字符 串 表 示 非 终结 
符号 , 所 有 非 斜体 的 名 字 或 符号 都 可 以 看 作 是 终结 符号 8。 为 表示 方便 ， 以 同一 个 非 终结 符号 为 
头 部 的 多 个 产生 式 的 体 可 以 放 在 一 起 表示 , 不 同体 之 间 用 符号 | ( 读 作 "或 " ) 分 隔 。 
在 本 章 中 , 有 多 个 例子 使 用 由 数位 和 + 、- 符号 组 成 的 表达 式 , 比如 9 -5 +2 .3 -1 或 
7 。 由 于 两 个 数位 之 间 必须 出 现 + 或 -， 我们 把 这 样 的 表达 式 称 为 “由 + 、- 号 分 隔 的 数位 序 





O 单个 斜体 字母 在 第 4 章 中 详细 讨论 文法 时 另 有 它 用 。 例 如 , 我 们 将 使 用 和 .了 和 了 来 表示 终结 符号 或 非 终结 符号 。 
但 是 ,包含 两 个 或 两 个 以 上 字符 的 任何 斜体 名 字 仍然 表示 一 个 非 终结 符号 。 
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列 ”。 下 面 的 文法 描述 了 这 种 表达 式 的 语法。 此 文法 的 产生 式 包 括 : 


list—list + digit (2.1) 

list—list — digit (2:2) 

list—digit (2.3) 

digt—0 11 12 13 14 15 16 17 18 19 (2.4) 


以 非 终结 符号 list 为 头 部 的 三 个 产生 式 可 以 等 价 地 组 合 为 
list—list + digit | list — digit | digit 
根据 我 们 的 习惯 , 该 文法 的 终结 符号 包括 如 下 符号 : 
+-0123456789 

该 文法 的 非 终结 符号 是 斜体 名 字 list 和 digit, AA list 的 产生 式 首先 被 列 出 ,所 以 我 们 知道 
list 是 此 文法 的 开始 符号 。 O 

如 果 某 个 非 终结 符号 是 某 个 产生 式 的 头 部 , 我 们 就 说 该 产生 式 是 该 非 终结 符号 的 产生 式 。 
一 个 终结 符号 串 是 由 零 个 或 多 个 终结 符号 组 成 的 序列 。 零 个 终结 符号 组 成 的 哩 称 为 空 串 (empty 
string) ， 记 为 ©, 
2.2.2 推导 

根据 文法 推导 符号 串 时 , 我 们 首先 从 开始 符号 出 发 , 不 断 将 某 个 非 终结 符号 替换 为 该 非 终结 
符号 的 某 个 产生 式 的 体 。 可 以 从 开始 符号 推导 得 到 的 所 有 终结 符号 串 的 集合 称 为 该 文法 定义 的 
语言 (language) 。 
由 例 2. 1 中 的 文法 定义 的 语言 是 由 加 减 号 分 隔 的 数位 列表 的 集合 。 非 终结 符号 digit 的 
10 个 产生 式 使 得 digit 可 以 表示 0、1、…、9 中 的 任意 数位 。 根 据 产 生 式 (2. 3 ) ,单个 数位 本 身 就 
是 一 个 ja。 产生 式 (2.1) 和 (2.2) 表 达 了 如 下 规则 : 任何 列表 后 跟 一 个 符号 + 或 -以 及 另 一 个 数 
位 可 以 构成 一 个 新 的 列表 。 

产生 式 (2. 1) ~ (2.4) 就 是 我 们 定义 所 期 望 的 语言 时 需要 的 全 部 产生 式 。 例 如 , 我 们 可 以 按 
照 如 下 方法 推导 出 9 -5 +2 是 一 个 listo 

1) 因为 9 digit , 根据 产生 式 (2.3) 可 知 9 是 listo 

2) 因为 5 是 digit, HO È lit, 由 产生 式 (2.2) 可 知 9 -5 也 是 listo 

3) 因为 2 是 digit, 9 -5 Æ list, 由 产生 式 (2.1) 可 知 , 9 -5+2 也 是 list, g 
另 一 种 稍 有 不 同 的 列表 是 函数 调用 中 的 参数 列表 。 在 Java 中 ,参数 是 包含 在 括号 中 
的 , 例如 max(x, yY) 表 示 使 用 参数 x Ay 调用 函数 max。 这 种 列表 的 一 个 微妙 之 处 是 终结 符 
号 “(” 和 “)” 之 间 的 参数 列表 可 能 是 空 串 。 我 们 可 以 为 这 样 的 序列 构造 出 具有 如 下 产生 式 的 
文法 : 





call — id ( optparams ) 
optparams — params | < 
params —> params , param | param 


注意 , 在 optparams(“ 可 选 参数 列表 ") 的 产生 式 中 , 第 二 个 可 选 规则 体 是 e CRAB A 
号 种 。 也 就 是 说 ，optparams A WR, 因此 一 个 cal 可 以 是 函数 名 加 上 两 个 终结 符号 
“CHO ARKAS P. WER, params 的 产生 式 和 例 2. 1 中 Lise 的 产生 式 类 似 ， 只 是 将 算术 运 
算 符 + 或 - 换 成 了 逗号 , 并 将 digit WR param。 函 数 参 数 实 际 上 可 以 是 任意 表达 式 , 但 是 在 这 里 








.从 技术 上 讲 , e 可 以 是 任意 字母 表 ( 符号 的 集合 ) 上 的 零 个 符号 组 成 的 串 。 
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我 们 没有 给 出 param 的 产生 式 。 稍 后 我 们 就 会 讨论 用 于 描述 不 同 的 语言 构造 ( 比如 表达 式 、 语 名 
等 ) 的 产生 式 。 
语法 分 析 ( parsing) 的 任务 是 : 接受 一 个 终结 符号 串 作为 输入 , 找 出 从 文法 的 开始 符号 推导 出 
这 个 串 的 方法 。 如 果 不 能 从 文法 的 开始 符号 推导 得 到 该 终结 符号 串 ， 则 报告 该 终结 符号 串 中 包 
含 的 语法 错误 。 语 法 分 析 是 所 有 编译 过 程 中 最 基本 的 问题 之 一 , 主要 的 语法 分 析 方法 将 在 第 4 章 
中 讨论 。 在 本 章 中 , 为 简单 起 见 , 我 们 首先 处 理 像 9 -5 + 2 这 样 的 源 程 序 , 其 中 的 每 个 字符 均 为 
一 个 终结 符号 。 一 般 情 况 下 ,一 个 源 程序 中 会 包含 由 多 字符 组 成 的 词素 , 这 些 词素 由 词法 分 析 器 
组 成 词法 单元 , 而 词法 单元 的 第 一 个 分 量 就 是 被 语法 分 析 器 处 理 的 终结 符号 。 
2.2.3 语法 分 析 树 
语法 分 析 树 用 图 形 方式 展现 了 从 文法 的 开始 符号 推导 出 相应 语言 中 的 符号 串 的 过 程 。 如 果 
非 终结 符号 4 有 一 个 产生 式 AAY, 那么 在 语法 分 析 树 中 就 可 能 有 一 个 标号 为 4 的 内 部 结 点 ， 
该 结 点 有 三 个 子 结 点 , 从 左 向 右 的 标号 分 别 为 X、Y、2: 














4 
ZIN 
x ¥ % 


正式 地 讲 , 给 定 一 个 上 下 文 无 关 文法 , 该 文法 的 一 棵 语法 分 析 树 (parse tree) 是 具有 以 下 性 质 的 树 : 

1) 根 结 点 的 标号 为 文法 的 开始 符号 。 

2) 每 个 叶子 结 点 的 标号 为 一 个 终结 符号 或 e。 

3) 每 个 内 部 结 点 的 标号 为 一 个 非 终结 符号 。 vo 

4) 如 果 非 终结 符号 4 是 某 个 内 部 结 点 的 标号 ,并 且 它 的 子 结 点 的 标号 从 左 至 右 分 别 为 X, 
Xp, e, Xn, 那么 必然 存在 产生 式 AX) XXn, HX, X, o, X, 既 可 以 是 终结 符号 , 也 可 
以 是 非 终结 符号 。 作 为 一 个 特殊 情况 ,如果 Ase 是 一 个 产生 式 , 那么 一 个 标号 为 4 的 结 点 可 以 
只 有 一 个 标号 为 上 的 子 结 点 。 





关于 树 型 结构 的 术语 

树 型 数据 结构 在 编译 系统 中 起 着 重要 的 作用 。 

e 一 棵 树 由 一 个 或 多 个 结 点 (node) 组 成 。 结 点 可 以 带 有 标号 (label ) , 在 本 书 中 标号 通常 
是 文法 符号 。 当 我 们 画 一 棵 树 时 , 我 们 常常 只 用 这 些 标号 来 代表 相应 的 结 点 。 

e 树 有 且 只 有 一 个 根 (root) 结 点 。 每 个 非 根 结 点 都 有 唯一 的 父 (parent) 结 点 ; 根 结 点 没 
有 父 结 点 。 当 我 们 画 树 的 时 候 , 将 一 个 结 点 的 父 结 点 画 在 它 的 上 方 , 并 在 父 、 子 结 点 
之 间 天 一 条 边 。 因 此 根 结 点 是 最 高 的 ( 顶层 的 ) 结 点 。 

o 如 果 结 点 入 是 结 点 以 的 父 结 点 , 那么 MRE N 的 子 (child) 结 点 。 一 个 结 点 的 各 个 子 

结 点 彼此 称 为 兄弟 (sibling) 结 点 。 它 们 之 问 是 有 序 的 , 按照 从 左 向 右 的 方式 排 烈 。 在 

我 们 画 一 棵 树 时 也 遵循 这 个 顺序 排列 给 定 结 点 的 子 结 点 。 

没有 子 结 点 的 结 点 称 为 叶子 (leaf) 结 点 。 其 他 结 点 , 即 有 一 个 或 多 个 子 结 点 的 结 点 ， 称 

为 内 部 结 点 (interior node) 。 

结 点 的 后 代 (descendant) 结 点 要 人 么 是 结 点 NAS, 要 么 是 NN 的 子 结 点 , 要 么 是 NN 的 

子 结 点 的 子 结 点 , 依 此 类 推 (可 以 为 任意 层次 ) 。 如 果 结 点 政 是 结 点 N 的 后 代 结 点 , 那 

么 结 点 六 是 结 点 M 的 祖先 (ancestor) 结 点 。 | 











AAA 2.279 -5 42 的 推导 可 以 用 图 2-5 中 的 树 来 演示 。 树 中 每 个 结 点 的 标号 都 是 一 个 
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文法 符 小 ,每 个 内 部 结 点 和 它 的 子 结 点 都 对 应 于 一 个 产生 式 。 其 中 ,内 部 结 点 对 应 于 产生 式 的 
k, 它 的 子 结 点 对 应 于 产生 式 的 体 。 

在 向 2.5 中 , 根 结 点 的 标号 为 iist, 即 例 2.1 中 文法 的 开始 符号 。 根 结 点 的 子 结 点 的 标号 从 左 
PJATA list, + 和 digit, THER: 

list—+list + digit 

是 例 2. 1 中 文法 的 产生 式 。 根 结 点 的 左 子 结 点 和 根 结 点 类 似 ， 只 
是 它 的 中 间 子 结 点 的 标号 为 - 而 不 是 + 。 三 个 标号 为 digit 的 结 ee i 
点 中 , 每 个 结 点 都 有 一 个 以 具体 数位 为 标号 的 子 结 点 。 口 Birt. | 

一 棵 语法 分 析 树 的 叶子 结 点 从 左 向 右 构成 了 树 的 结果 个 
(yield) , 也 就 是 从 这 棵 语法 分 析 树 的 根 结 点 上 的 非 终结 符号 推导 。 digit 
得 到 (或 者 说 生成 ) 的 符号 捉 。 在 图 2-5 中 的 结果 是 9-5+2。 为 。 1 。 ， ， 
了 方便 起 见 , 我 们 将 所 有 时 子 结 点 都 放 在 底层 。 以 后 我 们 不 一 定 
会 把 叶子 结 点 按照 这 种 方法 排列 。 任 何 树 的 叶子 结 点 都 有 一 个 “图 25 PRAD 1 中 的 文法 得 
monet 到 的 9 -5 +2 的 语法 分 析 树 
自然 的 从 左 到 右 的 顺序 。 这 个 顺序 基于 如 下 思想 : WORX A Y 
是 同一 个 父 结 点 的 子 结 点 , 并且 丰 在 了 的 左边 , 那么 X 的 所 有 后 代 结 点 都 在 Y 的 所 有 后 代 结 
点 的 左边 。 

一 个 文法 的 语言 的 另 一 个 定义 是 指 任何 能 够 由 某 棵 语法 分 析 树 生成 的 符号 串 的 集合 。 为 一 
个 给 定 的 终结 符号 串 构建 一 棵 语法 分 析 树 的 过 程 称 为 对 该 符号 串 进行 语法 分 析 。 
2.2.4 二 义 性 

在 根据 一 个 文法 讨论 某 个 符号 串 的 结构 时 , 我 们 必须 非常 小 心 。 一 个 文法 可 能 有 多 棵 语法 
分 析 树 能 够 生成 同一 个 给 定 的 终结 符号 串 。 这 样 的 文法 称 为 具有 二 义 性 (ambiguous) 。 要 证 明 一 
个 文法 具有 二 义 性 , 我 们 只 需要 找到 一 个 终结 符号 串 , 说 明 它 是 两 棵 以 上 语法 分 析 树 的 结果 。 因 
为 具有 两 棵 以 上 语法 分 析 树 的 符号 串通 常 具 有 多 个 含义 ,所 以 我 们 需要 为 编译 应 用 设计 出 没有 
二 义 性 的 文法 , 或 者 在 使 用 二 义 性 文法 时 使 用 附加 的 规则 来 消除 二 义 性 。 
UEG 假如 我 们 使 用 一 个 非 终结 符号 string, 并且 不 像 例 2. 1 中 那样 区 分 数位 和 列表 , 我们 可 
以 将 例 2. 1 中 的 文法 改写 如 下 : 

string—>string + string | string — string |O |1 12 13 14 15 16 17 18 19 

















将 符号 digit 和 lit 合并 为 非 终结 符号 string string string 
是 有 一 些 意义 的 , 因为 单个 digit 是 list 的 一 个 a : Pie ee : pN 
特例 。 | Hie see e 
但 是 , 图 2-6 说 明 ,在 使 用 这 个 文法 时 , 像 sg “se 2 本 
9 -5 +2 这 样 的 表达 式 会 有 多 棵 语法 分 析 树 。 图 o 5 2 
中 9 -5+2 的 两 棵 语法 分 析 树 对 应 于 两 种 带 括 号 图 2-6 9-542 的 两 棵 语法 分 析 树 


的 表达 式 : (9 -5) +2 和 9 - (5 +2)。 第 二 种 方 
法 给 出 的 表达 式 值 是 意 想 不 到 的 2, 而 不 是 通常 的 值 6。 例 2. 1 的 语法 不 支持 这 样 的 解释 。 口 
2.2.5 运算 符 的 结合 性 

依照 惯例 , 9 +5 +2 等 价 于 (9 +5)+2, 9 -5 -2 等 价 于 (3 -5) -2。 当 一 个 运算 分 量 。 
(比如 上 式 中 的 5) 的 左右 两 侧 都 有 运算 符 时 , 我 们 需要 一 些 规则 来 决定 哪个 运算 符 被 应 用 于 该 
运算 分 量 。 我 们 说 运算 符 “ + "是 左 结合 (associate) 的 ,因为 当 一 个 运算 分 量 左 右 两 侧 都 有 ”+ ” 
号 时 , 它 属于 其 左边 的 运算 符 。 在 大 多 数 程序 设计 语言 中 , 加 、 减 、 乘 、 除 四 种 算术 运算 符 都 是 
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左 结合 的 。 
某 些 常 用 运算 符 是 右 结合 的 ， 比 如 指数 运算 。 作 为 男 一 个 例子 , C 语言 中 的 赋值 运算 符 ”=” 
及 其 后 桨 (好 += 、-= 等 译 者 注 ) 也 是 右 结 合 的 。 也 就 是 说 , 对 表达 式 a =b = c 的 处 理 和 对 





表达 式 a= (b = c) 的 处 理 相 同 o list right 
带 有 右 结 合 运算 符 的 i , 比如 TE DAG a : i a : re 
可 以 由 如 下 文法 产生 :， Ao | | I、 
. list - digit 2 a letter = right 
right letter = right | letter | | | i 
letter > alb|---|z digit 5 b letter 
图 27 比较 了 一 个 左 结合 运算 符 ( 比 如 1 
“一 ”) 的 语法 分 析 树 和 一 个 右 结 合 运 算 符 ( 比 2-7 左 结 合 运 算 符 文 法 和 右 结 合 
如 * = ”) 的 语法 分 析 树 。 注 意 , 9 -5 -2 的 语 运算 符 文法 的 分 析 树 


法 分 析 树 向 左下 端 延伸 , 而 a = b = c 的 语法 分 析 树 则 向 右 下 端 延 伸 。 
2.2.6 运算 符 的 优先 级 

考虑 表达 式 9 + 5 * 3。 该 表达 式 有 两 种 可 能 的 解释 , 即 (9 +5) * 2 或 9 + (5*2)。+ 和 * 
的 结合 性 规则 只 能 作用 于 同一 运算 符 的 多 次 出 现 , 因此 它们 无 法 解决 这 个 二 义 性 。 为 此 , 当 多 种 
运算 符 出 现时 , 我 们 需要 给 出 一 些 规则 来 定义 运算 符 之 间 的 相对 优先 关系 。 

如 果 * FEF + 获得 运算 分 量 , 我 们 就 说 * 比 + 具有 更 高 的 优先 级 。 在 通常 的 算术 中 , 乘法 和 
除法 比 加 法 和 减法 具有 更 高 的 优先 级 。 因 此 在 表达 式 9 +5*2 和 9*5+2 中 ,都 是 运算 分 量 5 
首先 参与 * 运算 , 即 这 两 个 表达 式 分 别 等 价 于 9 + (5 *2) 和 (9 *5) +2。 
算术 表达 式 的 文法 可 以 根据 表示 运算 符 结 合 性 和 优先 级 的 表格 来 构建 。 我 们 首先 考虑 
四 个 常用 的 算术 运算 符 和 一 个 优先 级 表 。 在 此 优先 级 表 中 , 运算 符 按 照 优先 级 递增 的 顺序 排列 ， 
同一 行 上 的 运算 符 具 有 相同 的 结合 性 和 优先 级 : 

左 结合 : +- 
LaF: * / as 

我 们 创建 两 个 非 终结 符号 expr 和 term, 分 别 对 应 于 这 两 个 优先 级 层次 , 并 使 用 另 一 个 非 终 结 
符号 factor 来 生成 表达 式 中 的 基本 单元 。 当 前 , 表达 式 的 基本 单元 是 数位 和 带 括号 的 表达 式 。 

factor — digit | (expr) 

现在 我 们 考虑 有 具有 最 高 优先 级 的 二 目 运 算 符 * 和 /由 于 这 些 运 算 符 是 左 结合 的 , 因此 其 产 
生 式 和 左 结合 列表 的 产生 式 类 似 : 

term 一 term * factor 
| term / factor 
| factor 
类 似 地 ，expr 生成 由 加 减 运算 符 分 隔 的 term 列表 : 
expr 一 expr + term 
| expr — term 
| term 
因此 最 终 得 到 的 文法 是 : 
expr — expr + term | expr — term | term 
term — term * factor | term / factor | factor 


factor — digit | (expr) 
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Bi] 2.6 中 表达 式 文法 的 推广 

我 们 可 以 将 因子 (factor) 理解 成 不 能 被 任何 运算 符 分 开 的 表达 式 。“ 不 能 分 开 " 的 意思 是 
说 当 我 们 在 任意 因子 的 任意 一 边 放 置 一 个 运算 符 ， 都 不 会 导致 这 个 因子 的 任何 部 分 分 离 出 
来 ,成 为 这 个 运算 符 的 运算 分 量 。 当 然 ,， 因子 本 身 作为 一 个 整体 可 以 成 为 该 运算 符 的 一 个 运 
算 分 量 。 如 果 这 个 因子 是 一 个 由 括号 括 起 来 的 表达 式 , 那么 括号 将 起 到 保护 其 不 被 分 开 的 作 
用 。 如 果 朵 子 就 是 一 个 运算 分 量 , 那么 它 当然 不 能 被 分 开 。 

一 个 (不 是 因子 的 ) 项 (term) 是 一 个 可 能 被 高 优先 级 的 运算 符 * 和 /分 开 , 但 不 能 被 低 优 
先 级 运算 符 分 开 的 表达 式 。 一 个 (不 是 因子 也 不 是 项 的 ) 表 达 式 可 能 被 任何 一 个 运算 符 分 开 。 

我 们 可 以 把 这 种 思想 推广 到 具有 任意 n 层 优先 级 的 情况 。 我 们 需要 n+1 个 非 终结 符号 。 
首先 , 例 2.6 中 描述 的 factor 不 可 被 分 开 。 通 常 , 这 个 非 终结 符号 的 产生 式 体 只 能 是 单个 运算 
分 量 或 括号 括 起 来 的 表达 式 。 然 后 ,对 于 每 个 优先 级 都 有 一 个 非 终结 符 , 表示 能 被 该 优先 级 
或 更 高 优先 级 的 运算 符 分 开 的 表达 式 。 通 常 , 这 个 非 终 结 符 的 产生 式 有 一 些 产生 式 体 表示 了 
该 优先 级 的 运算 符 的 应 用 ; 另 有 一 个 产生 式 体 只 包含 了 代表 更 高 一 层 优先 级 的 非 终结 符号 。 














使 用 这 个 文法 时 ,一 个 表达 式 就 是 一 个 由 + 或 - 分 隔 开 的 项 (ierm) 的 列表 ， 而 项 是 由 * 或 / 
分 隔 的 因子 (jactor) 的 列表 。 请 注意 , 任何 由 括号 括 起 来 的 表达 式 都 是 一 个 因子 。 因 此 , 我 们 可 
以 使 用 括号 来 构造 出 具有 任意 嵌 套 深度 的 表达 式 ( 以 及 具有 任意 深度 的 语法 分 析 树 ) 。 口 
区 由 于 大 多 数 语句 是 由 一 个 关键 字 或 一 个 特殊 字符 开始 的 ， 因 此 关键 字 能 够 帮助 我 们 识 
别 语句 。 这 一 规则 的 例外 情况 包括 赋值 语句 和 过 程 调用 语句 。 由 图 2-8 中 的 (二 义 性 ) 文 法 定义 
的 语句 都 符合 Java 的 语法 。 

在 stmt 的 第 一 个 产生 式 中 , 终结 符号 过 表示 任意 标识 符 。 非 终结 符号 expression 的 产生 式 还 
没有 给 出 。 第 一 个 产生 式 描述 的 赋值 语句 符合 Java 的 语法 ,虽然 Java 将 = 号 看 作 是 可 出 现在 表 
达 式 内 部 的 赋值 运算 符 。 比 如 , 在 Java 中 允许 出 现 





stmt — id = expression ; 


a=b=c， 而 这 个 文法 不 允许 出 现 这 样 的 形式 。 if ( expression ) stmi 
非 终结 符号 stmis 产生 一 个 可 能 为 空 的 语句 列表 if ( expression ) stmt else stmt 
D E f while ( expression ) stmt 
simts 的 第 二 个 产生 式 生成 一 个 空 列表 Eo 第 一 个 产 生 式 do stmt while ( expression ) ; 


{ simts } 


生成 的 是 一 个 可 能 为 空 的 列表 再 跟 上 一 个 语句 。 

分 号 的 放置 方式 很 微妙 。 它 们 出 现在 所 有 不 以 stm | simts 一 stmts simt 
结尾 的 产生 式 的 末尾 。 这 种 方法 可 以 避免 在 这 或 while | 
这 样 的 语句 后 面 出 现 多 余 的 分 号 ， FAA if M while 语句 图 2.8 Java 语句 的 子 集 的 文法 
的 最 后 是 一 个 虹 套 的 子 语句 。 当 花 套 子 语句 是 一 个 赋 
值 语句 或 do-while 语句 时 , 分 号 将 作为 这 个 子 语句 的 一 部 分 被 生成 。 口 
2.2.7 2.2 节 的 练习 

练习 2. 2. 1: 考虑 下 面 的 上 下 文 无 关 文 法 : 

S>SS+1SS* la 

1) 试 说 明 如 何 使 用 该 文法 生成 串 aat+a*, 

2) 试 为 这 个 串 构造 一 棵 语法 分 析 树 。 

3) 该 文法 生成 的 语言 是 什么 ? 证 明 你 的 答案 。 

练习 2. 2.2: 下 面 的 各 个 文法 生成 什么 语言 ? 证 明 你 的 每 一 个 答案 。 

1)S$—+0S1101 
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2)S—++S5S1-SS ta 

3) S—>S(S)Sie 

4)S--aSbSibSaSle 

5)S—alS+SISSIS*1(S) 

练习 2. 2. 3: 练习 2.2.2 中 哪些 文法 具有 二 义 性 ? 

练习 2. 2.4: 为 下 面 的 各 个 语言 构建 无 二 义 性 的 上 下 文 无 关 文 法 。 证 明 你 的 文法 都 是 正 
确 的 。 

1) 用 后 缀 方式 表示 的 算术 表达 式 。 

2) 由 逗号 分 隔 开 的 左 结合 的 标识 符 列 表 。 

3) 由 逗号 分 隔 开 的 右 结合 的 标识 符 列表 。 

4) 由 整数 、 标 识 符 、 四 个 二 目 运 算 符 + - 、* 、/ 构 成 的 算术 表达 式 。 

! 5) 在 4) 的 运算 符 中 增加 单 目 + 和 单 目 - 构成 的 算术 表达 式 。 

练习 2. 2.5: 

1) 证 明 : 用 下 面 文法 生成 的 所 有 二 进 制 串 的 值 都 能 被 3 整除 。( 提示: 对 语法 分 析 树 的 结 点 
数目 使 用 数学 归纳 法 。) : 

num — 11 | 1001 | num 0 | num num 
2) 上 面 的 文法 是 否 能 够 生成 所 有 能 被 3 整除 的 二 进 制 串 ? 
练习 2. 2. 6: 为 罗马 数字 构建 一 个 上 下 文 无 关 文 法 。 


2.3 语法 制导 翻译 


语法 制导 翻译 是 通过 向 一 个 文法 的 产生 式 附 加 一 些 规则 或 程序 片段 而 得 到 的 。 比 如 , 考虑 

由 如 下 产生 式 生成 的 表达 式 expr: 
expr —> expr, + term 

这 里 ，expr 是 两 个 子 表达 式 expr, 和 term 的 和 。(expr 中 的 下 标 仅仅 被 用 于 将 产生 式 体 中 ex- 
pr 的 实例 和 产生 式 头 区 别 开 来 ) 。 我 们 可 以 利用 expr 的 结构 ,用 如 下 的 伪 代 码 来 翻译 expr: 

翻译 expr, ; 
ME term; 
处 理 + ; 

我 们 将 在 2. 8 节 中 使 用 这 段 伪 代码 的 一 个 变 体 , 为 espr 构 造 一 棵 语法 分 析 树 : 我 们 首先 建立 
expr, 和 term 的 语法 分 析 树 , 然后 处 理 + 运算 符 并 构造 得 到 一 个 和 此 运算 符 对 应 的 结 点 。 为 方便 
EIL, 本 节 中 的 例子 是 从 中 级 表达 式 到 后 缀 表达 式 的 翻译 。 

本 节 介绍 两 个 与 语法 制导 翻译 相关 的 概念 : 

o 属性 (attribute) : 属性 表示 与 某 个 程序 构造 相关 的 任意 的 量 。 属 性 可 以 是 多 种 多 样 的 ， 比 
如 表达 式 的 数据 类 型 、 生 成 的 代码 中 的 指令 数目 或 为 某 个 构造 生成 的 代码 中 第 一 条 指令 
的 位 置 等 等 都 是 属性 的 例子 。 央 为 我 们 用 文法 符号 (终结 符号 或 非 终结 符号 ) 来 表示 程序 
构造 ,所 以 我 们 将 属性 的 概念 从 程序 构造 扩展 到 表示 这 些 构造 的 文法 符号 上 。 

(语法 制导 的 ) 翻译 方 案 (translation scheme) : 翻译 方案 是 一 种 将 程序 片段 附加 到 一 个 文法 
的 各 个 产生 式 上 的 表示 法 。 当 在 语法 分 析 过 程 中 使 用 一 个 产生 式 时 ,相应 的 程序 片段 就 
会 执行 。 这 些 程序 片段 的 执行 效果 按照 语法 分 析 过 程 的 顺序 组 合 起 来 , 得 到 的 结果 就 是 
这 次 分 析 / 综 合 过 程 处 理 源 程 序 得 到 的 翻译 结果 。 

语法 制导 的 翻译 方案 将 在 本 章 中 多 次 使 用 , 它 将 用 于 把 中 组 表达 式 翻 译 成 后 缀 表达 式 , 还 会 用 
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于 表达 式 求 值 , 并 用 来 构建 一 些 程序 构造 的 扫 象 语法 树 。 第 5 章 将 更 详细 地 讨论 语法 制导 表示 法 。 
2.3.1 后 缀 表示 

本 节 中 的 例子 处 理 的 是 中 缀 表达 式 到 其 后 织 表 示 的 翻译 。 一 个 表达 式 E 的 后 级 表示 ( postfix 
notation ) 可 以 按照 下 面 的 方式 进行 归纳 定义 : 

1) 如 果 歼 是 一 个 变量 或 常量 , WE WR EARS, 

2) MRE BEE, op Es 的 表达 式 , 其 中 op 是 一 个 二 目 运 算 符 , 那么 E 的 后 缀 表示 是 
E',E',0p, 这 里 EI 和 E's 分别 是 El 和 ,的 后 缀 表示 。 

3) 如 果 忆 是 一 个 形 如 ( Ei ) 的 被 括号 括 起 来 的 表达 式 , 则 的 后 级 表示 就 是 Fi AO 








AAG 《9-5)+2 的 后 缀 表示 是 95- 2+ 。 也 就 是 说 , 由 规则 1 可 知 , 9、5 和 2 的 翻译 结果 就 是 
这 些 常量 本 身 。 然 后 , 根据 规则 2, 9-5 的 翻译 结果 是 95- 。 由 规则 3 可 知 ,，(9-5) 的 翻译 结果 
与 此 相同 。 翻 译 完 带 括号 的 子 表达 式 后 , 我 们 可 以 将 规则 2 应 用 于 整个 表达 式 ,( 9- 5 ) 就 是 £, 
2 AE), 由 此 得 到 结果 95-2 +。 

再 举 另 外 一 个 例子 , 9- (5+ 2 ) 的 后 缀 表达 式 是 952 + - 。 也 就 是 说 , 5 + 2 首先 被 翻译 成 52 +， 
然后 这 个 表达 式 又 成 为 减 号 的 第 二 个 运算 分 量 。 

运算 符 的 位 置 和 它 的 运算 分 量 个 数 (arity ) 使 得 后 缀 表达 式 只 有 一 种 解码 方式 , MURR 
表示 中 不 需要 括号 。 处 理 后 缀 表达 式 的 “技巧 ”就 是 从 左边 开始 不 断 扫 描 后 缀 串 , 直到 发 现 一 个 
运算 符 为 止 。 然 后 向 左 找 出 适当 数目 的 运算 分 量 , 并 将 这 个 运算 符 和 它 的 运算 分 量 组 合 在 一 起 。 
计算 出 这 个 运算 符 作 用 于 这 些 运算 分 量 上 后 得 到 的 结果 , 并 用 这 个 结果 替换 原来 的 运算 分 量 和 
运算 符 。 然 后 继续 这 个 过 程 ， 向 右 搜寻 另 一 个 运算 符 。 
考虑 后 缀 表达 式 952+ -3 * 。 从 左边 开始 扫描 , 我 们 首先 直到 加 号 。 向 加 号 的 左边 看 ， 
我 们 找到 运算 分 量 5 和 7。 用 它们 的 和 7 替换 原来 的 52+ , 这样 我 们 得 到 串 97- 3 * 。 现 在 最 左 
边 的 运算 符 是 减 号 , 它 的 运算 分 量 是 9 和 7。 将 这 些 符号 将 换 为 它们 的 差 , 得 到 23 * 。 最 后 , 将 
乘 号 应 用 在 2 和 3 k, 得 到 结果 6。 
2. 3.2 综合 属性 

将 量 和 程序 构造 关联 起 来 ( 比如 把 数值 及 类 型 和 表达 式 相 关联 ) 的 想法 可 以 基于 文法 来 表示 。 
我 们 将 属性 和 文法 的 非 终 结 符号 及 终结 符号 相关 联 。 然 后 , 我 们 给 文法 的 各 个 产生 式 附 加 上 语 
义 规则 。 对 于 语法 分 析 树 中 的 一 个 结 点 , 如 果 它 和 它 的 子 结 点 之 间 的 关系 符合 某 个 产生 式 , 那么 
该 产生 式 对 应 的 规则 就 描述 了 如 何 计算 这 个 结 点 上 的 属性 。 

语法 制导 定义 (syntax-direcied definition) 把 每 个 文法 符号 和 一 个 属性 集合 相关 联 , 并 且 把 
@ 每 个 产生 式 和 一 组 语义 规则 (semantic rule) 相关 联 , 这 些 规则 用 于 计算 与 该 产生 式 中 符号 相关 
联 的 属性 值 。 

属性 可 以 按照 如 下 方式 求 值 。 对 于 一 个 给 定 的 输入 串 *, 构建 x 的 一 个 语法 分 析 树 。 然 后 按 
照 下 面 的 方法 应 用 语义 规则 来 计算 语法 分 析 树 中 各 个 结 点 的 属性 。 

假设 语法 分 析 树 的 一 个 结 点 N 的 标号 为 文法 符号 X。 我 们 用 Xa 表示 该 结 点 上 无 的 属性 
的 值 。 如 果 一 棵 语法 分 析 树 的 各 个 结 点 上 标记 了 相应 的 属性 值 , 那么 这 棵 语法 分 析 树 就 称 为 注 
释 (annotated ) 语 法 分 析 树 (简称 注释 分 析 树 ) 。 比 如 , 图 2-9 显示 了 9- 5 +2 的 一 棵 注释 分 析 树 ， 
其 中 属性 :与 非 终结 符号 expr 和 term 关联 。 该 属性 在 根 结 点 处 的 值 为 95- 2 +, 也 就 是 9- 5 +2 的 
后 缀 表示 。 我 们 很 快 会 看 到 这 些 表达 式 的 计算 方法 。 

如 果 某 个 属性 在 语法 分 析 树 结 点 N 上 的 值 是 由 NN 的 子 结 点 以 及 NN 本 身 的 属性 值 确定 的 , 那 
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么 这 个 属性 就 称 为 综合 属性 (synthesized attribute ) 。 综 合 属性 具有 一 个 很 好 的 性 质 : 只 需要 对 语法 


分 析 树 进行 一 次 自 底 向 上 的 遍历 ’ 就 可 以 计算 出 属 erpr.t = 95-2+ 

性 的 值 。 在 5.1.1 节 中 , 我 们 将 讨论 另外 一 种 重要 ae 

的 属性 :“ 继 承 " 属 性 。 非 正式 地 讲 , 继承 属 性 在 某 We - ome 
个 语法 分 析 树 结 点 上 的 值 是 由 语法 分 析 树 中 该 结 点 apis Pug oe ‘ 


本 身 、 父 结 点 以 及 兄弟 结 点 上 的 属性 值 决 定 的 。 | | 

PRT a29 中 的 注释 分 析 树 是 根据 图 2-10 1” 

中 的 语法 制导 定义 得 到 的 。 该 语法 制导 定义 用 于 9 

把 一 个 表达 式 翻 译 成 为 该 表达 式 的 后 组 形式 , 待 、 图 2.9 一 个 语法 分 析 树 的 各 个 结 点 上 的 属性 值 
翻译 的 表达 式 是 一 个 由 加 号 和 减 号 分 隔 的 数位 序 

列 。 图 中 每 个 非 终 结 符号 有 一 个 值 为 字符 串 的 属性 i, 它 表 示 由 该 非 终 结 符号 生成 的 表达 式 的 后 
级 表示 形式 。 语 义 规则 中 的 符号 ‖ 表示 











Te phe ot ae 
字符 串 的 连接 运算 符 。 FFE = + term | expr.t = a eae {| ‘+ 
一 个 数位 的 后 缀 形式 是 该 数位 本 身 。 expr expr, ~ term | expr.t = exprit || term.t || '-' 
例如 ， 与 产生 式 tem 一 9 相关 联 的 语义 “| expr > term ezpr.t = term.t 
规则 定义 如 下 : 当 该 产生 式 被 应 用 在 语法 “| "一 ， et 
分 析 树 的 某 个 结 点 上 时 ，term. t 的 值 就 是 a ar 
9 本 身 。 其 他 数位 也 按照 类 似 的 方法 进行 ”| term 9 termi g 








翻译 。 再 如 ， 当 产生 式 expr—term 被 应 用 
AY, term. t 的 值 成 为 expr. t 的 值 。 

产生 式 expr—vexpr, + term 推导 出 一 个 带 有 加 号 的 表达 式 。 加 法 运算 符 的 左 运算 分 量 由 ex- 
pr, 给 出 , 右 运算 分 量 由 ierm 给 出 。 与 这 个 产生 式 关 联 的 语义 规则 

expr.t = expr;.t || term.t || + 

定义 了 计算 属性 expr. t 的 值 的 方式 , CHODIRLARDA ARREK expr,.t 和 term. t 
连接 起 来 , 再 在 后 面 加 上 加 号 , 就 得 到 了 属性 expr. t 的 值 。 这 个 规则 是 后 缀 表达 式 定 义 的 一 个 公 
式 化 表示 。 口 


图 2-10 ”从 中 缀 表示 到 后 缀 表示 的 翻译 的 语法 制导 定义 





区 分 一 个 非 终结 符号 的 不 同 使 用 的 规则 

在 规则 中 , 我 们 经 常 要 区 分 同一 个 非 终 结 符号 在 一 个 产生 式 的 头 和 /或 体 中 的 多 次 使 用 ， 
在 例 2. 10 中 就 有 这 样 的 情况 。 原 因 是 在 语法 分 析 树 中 , 标号 为 同一 个 非 终 结 符号 的 不 同 结 点 
通常 在 翻译 中 具有 不 同 的 属性 值 。 我 们 将 采用 下 面 的 规则 : 出 现在 产生 式 头 中 的 非 终结 符号 
没有 下 标 ， 而 在 产生 式 体 中 的 非 终 结 符 号 带 有 不 同 的 下 标 。 同 一 个 非 终结 符号 的 所 有 出 现 都 
按照 这 种 方式 区 分 , 并 且 下 标 不 是 名 字 的 组 成 部 分 。 然 而 , 读者 应 该 注意 使 用 了 这 种 下 标 约 
定 的 特定 翻译 规则 和 AX, XX, 这 样 表示 一 般 形式 的 产生 式 的 区 别 。 在 后 者 中 , 带 下 标的 
表示 任意 文法 符号 的 列表 ,而 不 是 某 个 名 为 了 的 非 终 结 符号 的 不 同 实例 。 


























O 在 这 个 规则 以 及 很 多 其 他 的 规则 中 ， 同 一 个 非 终结 符号 (这 里 是 expr) 会 在 一 个 产生 式 中 出 现 多 次 。expr 中 的 下 
标 1 用 于 区 分 产生 式 中 expr 的 两 次 出 现 , 但 “1 并 不 是 该 非 终结 符号 的 一 部 分 。 在 下 面 的 "区 分 一 个 非 终结 符号 
的 不 同 使 用 的 约定 " 中 有 更 加 详细 的 描述 。 
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2.3.3 ”简单 语法 制导 定义 

例 2. 10 中 的 语法 制导 定义 具有 下 面 的 重要 性 质 : 要 得 到 代表 产生 式 头 部 的 非 终结 符号 的 翻 
译 结果 的 字符 串 ， 只 需要 将 产生 式 体 中 各 非 终结 符号 的 翻译 结果 按照 它们 在 非 终结 符号 中 的 出 
现 顺 序 连接 起 来 ,并 在 其 中 穿插 一 些 附加 的 串 即 可 。 具 有 这 个 性 质 的 语法 制导 定义 称 为 简单 
(simple) 语 法 制导 定义 。 





时 考虑 图 2-10 中 的 第 一 个 产生 式 和 语义 规则 : 
产生 式 语义 规则 
expr — expr, + term expr. t = expri.t ||term.t || '+' 


这 里 ， 翻 译 结果 expr. t 是 expr, 和 term 的 翻译 结果 的 连接 ,再 跟 一 个 加 号 。 请 注意 ，exzpr 和 
term 在 产生 式 体 中 和 语义 规则 中 的 出 现 顺 序 是 相同 的 。 在 它们 的 翻译 结果 之 前 和 之 间 没 有 其 他 
符号 。 在 这 个 例子 中 , 唯一 的 附加 符号 出 现在 结尾 处 。 口 

当 讨论 翻译 方案 的 时 候 , 我 们 将 看 到 , 一 个 简单 语法 制导 定义 的 实现 很 简单 ， 只 需要 按照 它 
们 在 定义 中 出 现 的 顺序 打印 出 附加 的 串 即 可 。 

2.3.4 树 的 遍历 

树 的 遍历 将 用 于 描述 属性 的 求 值 过 程 , 以 及 描述 一 个 翻译 方案 中 的 各 个 代码 片段 的 执行 过 
程 。 一 个 树 的 遍历 (traversal) 从 根 结 点 开始 , 并 按照 某 个 顺序 访问 树 的 各 个 结 点 。 

一 次 深度 优先 (depth-first) 遍历 从 根 结 点 开始 , 递归 地 按照 任意 顺序 访问 各 个 结 点 的 子 结 点 ， 
并 不 一 定 要 按照 从 左 向 右 的 顺序 遍历 。 之 所 以 称 之 为 深度 优先 , 是 因为 这 种 遍历 总 是 尽 可 能 地 
访问 一 个 结 点 的 尚未 被 访问 的 子 结 点 , 因此 它 总 是 尽 可 能 快 地 访问 离 根 结 点 最 远 的 结 点 ( 即 最 深 
的 结 点 )。 


Z 得 oe N) oP AS procedure visit(node N) { 
PA ee ee) ee eee for (MERR NOME TEAC) { 





历 , 它 按照 从 左 向 右 的 顺序 访问 一 个 结 点 的 子 结 点 ， i visit(C); 
如 图 2-12 所 示 o 在 这 个 遍历 中 , 完成 某 个 结 点 的 遍 按照 结 点 N 上 的 语义 规则 求 值 ， 


历 之 前 ( 也 就 是 在 该 结 点 的 各 个 子 结 点 的 翻译 结果 
都 计算 完毕 之 后 ) , 我 们 加 入 了 计算 每 个 结 点 的 翻 
译 结果 的 动作 。 一 般 来 说 , 我 们 可 以 任意 选 定 和 一 
次 遍历 过 程 相关 联 的 动作 ， 当 然 也 可 以 选择 什么 都 
不 做 。 

语法 制导 定义 没有 规定 一 棵 语法 分 析 树 中 各 个 
属性 值 的 求 值 顺序 。 只 要 一 个 顺序 能 够 保证 计算 属 
性 a 的 值 时 ,ca 所 依赖 的 其 他 属性 都 已 经 计算 完毕 ， 
-这 个 顺序 就 是 可 以 接受 的 。 综 合 属性 可 以 在 自 底 向 ee aes 
上 遍历 的 时 候 计 算 。 自 顶 向 上 遍历 指 在 计算 完成 菜 图 2-12 PARE Oy 
个 结 点 的 所 有 子 结 点 的 属性 值 之 后 才 计 算 该 结 点 的 属性 值 的 过 程 。 一 般 来 说 , 当 既 有 综合 属性 
又 有 继承 属性 时 ,关于 求 值 顺序 的 问题 就 变 得 相当 复杂 ,参见 5.2 节 。 
2.3.5 翻译 方案 

图 2-10 中 的 语法 制导 定义 将 字符 串 作为 属性 值 附加 在 语法 分 析 树 的 结 点 上 ， 从 而 得 到 翻译 
结果 。 我 们 现在 来 考虑 另外 一 种 不 需要 操作 字符 串 的 方法 。 它 通过 运行 程序 片段 , 逐步 生成 相 
同 的 翻译 结果 。 





2-11 一 棵 树 的 深度 优先 遍历 
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前 序 遍 历 和 后 序 遍 历 
前 序 遍 历 和 后 序 遍 历 是 深度 优先 遍历 的 两 种 重要 的 特例 。 在 这 两 种 遍历 中 , 我 们 都 是 从 
左 到 右 递 归 地 访问 每 个 结 点 的 子 结 点 。 
我 们 经 常 遍 历 一 棵 树 ， 并 在 各 个 结 点 上 执行 某 些 特定 的 动作 。 如 果 动 作 在 我 们 第 一 次 访 
问 一 个 结 点 时 被 执行 ,那么 我 们 将 这 种 遍历 称 为 前 序 遍 历 (preorder traversal) 。 类 似 地 ， 如 


图 2-11 中 的 过 程 wsiz(N) 就 是 一 个 后 序 遍 历 的 例子 。 

前 序 遍 历 和 后 序 遍 历 根 据 一 个 结 点 的 动作 执行 时 间 来 定义 这 些 结 点 的 相应 次 序 。 一 棵 以 
结 点 为 根 的 ( 子 ) 树 的 前 序 排序 由 NN, 跟 上 它 的 从 左 到 右 的 每 棵 子 树 ( 如 果 存 在 ) 的 前 序 排序 
组 成 。 而 一 棵 以 结 点 入 为 根 的 ( 子 ) 顶 的 后 序 排序 则 由 放 的 从 左 到 右 的 每 棵 子 树 的 后 序 排序 ， 
AERE N 自身 组 成 。 








语法 制导 翻译 方案 是 一 种 在 文法 产生 式 中 附加 一 些 程序 片段 来 描述 翻译 结果 的 表示 方法 。 
语法 制导 翻译 方案 和 请 法 制导 定义 相似 ,只 是 显 式 指定 了 语义 规则 的 计算 顺序 。 

被 府 和 人 到 产生 式 体 中 的 程序 片段 称 为 语义 动作 (semantic action ) 。 一 个 语义 动作 用 花 括 号 括 
起 来 , 并 写 人 产生 式 的 体 中 , 它 的 执行 位 置 也 由 此 指定 , 如 下 面 的 规则 所 示 ; 

rest 一 + term |print(' +')} rest, 

当 我 们 考虑 表达 式 的 另 一 种 形式 的 文法 时 , 我 们 就 会 看 到 这 样 的 规则 ,其 中 非 终结 符号 rext 
代表 “一 个 表达 式 中 除 第 一 个 项 之 外 的 一 切 ”。 这 种 形式 的 文法 将 在 2.4.5 节 中 讨论 。 此 外 ，restl 
中 的 下 标 将 非 终结 符号 rest 在 产生 式 体 中 的 实例 与 产生 式 头 部 的 rest 实例 区 分 开 来 。 

当 我 们 画 出 一 个 翻译 方案 的 语法 分 析 树 时 ,我 们 为 每 个 语义 动作 构造 一 个 额外 的 子 结 点 ， 并 
击 用 虚线 将 它 和 j 头 部 对 应 的 结 点 相连 。 侦 示 上 is 

A R T ES Vo et . 
于 语义 动作 的 结 点 没有 子 结 点 , 因此 在 第 一 次 访问 该 结 点 时 就 TO DiG) eh 
会 执行 这 个 动作 。 图 2-13 ”为 一 个 语义 动作 创建 
Cee 图 2-14 的 语法 分 析 树 在 额外 的 叶子 结 点 中 含有 打 一 个 额外 的 叶子 结 点 
印 语句 。 这 些 叶 子 结 点 通过 虚线 与 语法 分 析 树 的 内 部 结 点 相连 接 。 它 的 翻译 方案 如 图 2-15 所 示 。 
该 翻译 方案 的 基础 文法 生成 了 由 符号 + 和 - 分 隔 的 数位 序列 组 成 的 表达 式 。 假 设 我 们 对 整 棵 树 
进行 从 左 到 右 的 深度 优先 遍历 , 并 在 我 们 访问 它 的 叶子 结 点 时 执行 每 个 打印 语句 , 那么 产生 式 体 
中 内 髋 的 语义 动作 将 把 这 样 的 表达 式 翻 译 为 相应 的 后 缀 表示 形式 。 


a e 





expr term {print('+")} 
as `a ` 
LAK \ “ey. / Ye 
expr - term {print (/-')} 2 {print('2')} 
term 5 {print(‘5’)} 


9 {print(’s")} 
图 2-14 把 9-5+2 翻译 成 95 -2+ 的 语义 动作 
图 2-14 的 根 结 点 代表 图 2-15 中 的 第 一 个 产生 式 。 这 个 根 结 点 的 最 左边 的 子 树 代表 左边 的 运 
算 分 量 , 它 的 标号 和 根 结 点 一 样 都 是 expr。 在 一 次 后 序 遍 历 中 , 我 们 首先 执行 该 子 树 中 的 所 有 语 


果 动 作 在 我 们 最 后 离开 一 个 结 点 前 被 执行 , 则 称 这 种 凯 历 为 后 序 遍 历 (Ppostorder traversal) 。 |; F 
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义 动作 。 然 后 我 们 访问 没有 语义 动作 的 叶子 结 点 + 。 接 下 来 , 我 们 执行 代表 右 运 算 分 量 term 的 








子 树 中 的 所 有 请 义 动作 。 最 后 执行 额外 结 点 上 的 请 义 动作 一 一 = 
expr > expr, + term {print(‘+)} 

| print( +") fo. eipr ~ expr, -term {print('-')} 
由 于 term 的 产生 式 的 右 部 只 有 一 个 数位 , 该 产生 式 的 语 | 了 0 (print (‘0')} 

义 动 作 把 这 个 数位 打印 出 来 。 产 生 式 expr—sterm 不 需要 产生 | term => 1 {print(‘1’)} 

答 出， 只 有 前 面 两 个 产生 式 的 语义 动作 中 的 运算 符 才 会 打印 |， ， a g plain 

出 来 。 图 2-14 中 的 语义 动作 在 对 语法 分 析 树 的 后 序 遍历 中 

执行 时 会 打印 出 95 -2+。 口 图 2-15 ”把 表达 式 翻 译 成 后 
注意 , 尽管 图 2-10 和 图 2-15 中 的 翻译 方案 产生 相同 的 绷 形 式 的 语义 动作 


翻译 结果 , 但 它们 构造 结果 的 过 程 是 不 同 的 。 图 2-10 是 把 字符 上 串 作为 属性 附加 到 语法 分 析 树 中 
的 结 点 上 , 而 图 2-15 通过 语义 动作 把 翻译 结果 以 增 量 方式 打印 出 来 。 

如 图 2-14 所 示 的 语法 分 析 树 中 的 语义 动作 将 中 缀 表达 式 9 -5 +2 翻译 成 95 -2 +， 它 恰好 
将 9-5+2 中 的 每 个 字符 各 打印 一 次 。 它 不 需要 任何 附加 空间 来 存放 子 表 达 式 的 翻译 结果 。 当 
按照 这 种 方式 递增 地 创建 输出 时 , 字符 的 打印 顺序 非常 重要 。 

实现 一 个 翻译 方案 时 ,必须 保证 各 个 语义 动作 按照 它们 在 语法 分 析 树 的 后 序 遍历 中 的 顺序 
执行 。 这 个 实现 不 一 定 要 真 的 构造 出 一 棵 语法 分 析 树 (通常 也 不 会 这 么 做 ) ， 只 要 能 够 确保 语义 
动作 的 执行 过 程 等 同 于 我 们 真 的 构建 了 语法 分 析 树 并 在 后 序 遍 历 中 执行 这 些 动作 时 的 情形 。 
2.3.6 2.3 节 的 练习 

练习 2. 3. 1: 构建 一 个 语法 制导 翻译 方案 , 该 方案 把 算术 表达 式 从 中 缀 表示 方式 翻译 成 运算 符 
在 运算 分 量 之 前 的 前 缀 表示 方式 。 例 如 ，-xy ERER x-y 的 前 缀 表示 法 。 给 出 输入 9 -5 + 2 和 
9 -5*2 的 注释 分 析 树 。 

练习 2. 3. 2: 构建 一 个 语法 制导 翻译 方案 ,该 方案 将 算术 表达 式 从 后 缀 表示 方式 翻译 成 中 组 
表示 方式 。 给 出 输入 95 -2* 和 952*- 的 注释 分 析 树 。 

练习 2. 3. 3: 构建 一 个 将 整数 翻译 成 罗马 数字 的 语法 制导 翻译 方案 。 

练习 2.3.4: 构建 一 个 将 罗马 数字 翻译 成 整数 的 语法 制导 翻译 方案 。 

练习 2. 3. 5: 构建 一 个 将 后 缀 算术 表达 式 翻 译 成 等 价 的 前 缀 算术 表达 式 的 语法 制导 翻译 
方案 。 


2.4 语法 分 析 


语法 分 析 是 决定 如 何 使 用 一 个 文法 生成 一 个 终结 符号 串 的 过 程 。 在 讨论 这 个 间 题 时 , 我 们 
可 以 想象 我 们 正在 构建 一 个 语法 分 析 树 , 这 样 可 以 帮助 我 们 理解 分 析 的 过 程 , 尽管 在 实践 中 编译 
器 并 没有 真 的 构造 出 这 裸 树 。 然 而 , 原则 上 语法 分 析 器 必须 能 够 构造 出 语法 分 析 树 ,否则 将 无 法 
保证 翻译 的 正确 性 。 

本 节 将 介绍 一 种 称 为 “递归 下 降 ” 的 语法 分 析 方 法 , 该 方法 可 以 用 于 语法 分 析 和 实现 语法 制 
导 翻 译 器 。 下 一 节 将 给 出 一 个 实现 了 图 2:15 中 的 翻译 方案 的 完整 Java 程序 。 另 一 种 可 行 的 方法 
是 使 用 软件 工具 直接 根据 翻译 方案 生成 一 个 翻译 器 。4. 9 节 将 描述 一 个 这 样 的 工具 一 一 Yacc。 使 
用 这 个 工具 , 无 需 修改 就 可 以 实现 图 2-15 中 的 翻译 方案 。 

对 于 任何 上 下 文 无 关 文法 , 我 们 都 可 以 构造 出 一 个 时 间 复 杂 度 为 0(m3 ) 的 语法 分 析 器 , 它 最 
多 使 用 0(m ) 的 时 间 就 可 以 完成 一 个 长 度 为 的 符号 串 的 语法 分 析 。 但 是 ,三 次 方 的 时 间 代 价 
一 般 来 说 太 昂贵 了 。 幸 运 的 是 ,对 于 实际 的 程序 设计 语言 而 言 , 我 们 通常 能 够 设计 出 一 个 可 以 被 
高 效 分 析 的 文法 。 线 性 时 间 复 杂 度 的 算法 足以 分 析 实 践 中 出 现 的 各 种 程序 设计 语言 。 程 序 设计 
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语言 的 语法 分 析 器 几乎 总 是 一 次 性 地 从 左 到 右 扫 撒 输入 , 每 次 向 前 看 一 个 终结 符号 , 并 在 扫描 时 
构造 出 分 析 树 的 各 个 部 分 。 

大 多 数 语法 分 析 方 法 都 可 以 归 人 以 下 两 类 : 自 顶 向 下 (top-down) 方 法 和 自 底 向 上 (bottom-up) 
方法 。 这 两 个 术 请 指 的 是 语法 分 析 树 结 点 的 构造 顺序 。 在 自 项 向 下 语法 分 析 器 中 , 构造 过 程 从 
根 结 点 开始 , 逐步 向 叶子 结 点 方向 进行 ; 而 在 自 底 向 上 语法 分 析 器 中 , 构造 过 程 从 叶子 结 点 开 
tn, 逐步 构造 出 根 结 点 。 自 顶 向 下 语法 分 析 器 之 所 以 受 欢迎 ， 是 因为 使 用 这 种 方法 可 以 较 容易 地 
手工 构造 出 高 效 的 语法 分 析 器 。 不 过 , 自 底 向 上 分 析 方 法 可 以 处 理 更 多 种 文法 和 翻译 方案 ， 所 以 
直接 从 文法 生成 语法 分 析 器 的 软件 工具 常常 使 用 自 底 向 上 的 方法 。 

2.4.1 自 顶 向 下 分 析 方 法 

我 们 在 介绍 自 顶 向 下 的 分 析 方 法 时 考虑 的 文法 适合 使 用 自 顶 向 下 分 析 技 术 。 在 本 节 后 面 的 
KAF, 我 们 将 考虑 构造 自 顶 向 下 语法 分 析 器 的 一 般 方法 。 图 2-16 中 的 文法 生成 C Java 语句 
的 一 个 子 集 。 我 们 分 别 用 黑体 终结 符 证 和 for p 
表示 关键 字 “if” 和 “for”, 以 强调 这 些 字符 序 | 
列 被 视 为 一 个 单元 ， 也 就 是 单个 终结 符号 。 此 | T O ; optezpr ; optezpr ) stmt 
dh, 终结 符 expr 代表 表达 式 。 一 个 更 完整 的 文 
法 将 使 用 非 终结 符号 epr, 并 带 有 多 个 关于 非 I T Lop 
终结 符号 expr 的 产生 式 。 类 似 地 , other 是 一 个 ' 
代表 其 他 语句 构造 的 终结 符号 。 F216 O AA Javi Size Ri AA ICS 

在 自 顶 向 下 地 构造 一 棵 如 图 2-17 所 示 的 语法 分 析 树 时 ， 从 标号 为 开始 非 终结 符 simt 的 根 结 
点 开始 ,反复 执行 下 面 两 个 步 又: 

1) 在 标号 为 非 终 结 符号 4 的 结 点 N 上, 选择 4 的 一 个 产生 式 , 并 为 该 产生 式 体 中 的 各 个 符 
号 构造 出 入 的 子 结 点 。 stmt 


2) 寻找 下 一 个 结 点 来 鬼 造 子 树 , 通 第 迁 YIN 


择 的 是 语法 分 析 树 最 左边 的 尚未 扩展 的 非 终 “” “ ee Wi 


结 符 2 € expr expr other 

对 于 某 些 文法 ， 上 面 的 步 又 只 需要 对 输 eee 
入 捉 进 行 一 次 从 左 到 右 的 扫描 就 可 以 完成 。 图 2-17 根据 图 2-16 中 的 文法 得 到 的 语法 分 析 树 
输入 中 当前 被 扫描 的 终结 符号 通常 称 为 向 前 看 (lookahead) 符 号。 在 开始 时 , 向 前 看 符号 是 输入 
串 的 第 一 个 ( 即 最 左 的 ) 终 结 符号 。 图 2-18 演示 了 构造 如 下 输入 串 的 语法 分 析 树 的 过 程 : 

for (; expr ; expr ) other 

得 到 的 语法 分 析 树 如 图 2-17 所 示 。 一 开始 , 向 前 看 符号 是 终结 符号 for, 语法 分 析 树 的 已 知 
部 分 只 包含 标号 为 开始 非 终结 符号 stm 的 根 结 点 , 如 图 2-18a 所 示 。 我 们 的 目标 是 以 适当 的 方法 
构造 出 语法 分 析 树 的 其 余部 分 , 使 得 这 棵 树 生 成 的 符号 串 与 输入 符号 串 匹 配 。 

为 了 与 输入 串 匹配 , 图 2-18a 中 的 非 终结 符号 seme 必须 推导 出 一 个 以 向 前 看 符号 for 开头 的 
$, TER 2-16 所 示 的 文法 中 ，stmi 只 有 一 个 产生 式 可 以 推导 出 这 样 的 串 , 所 以 我 们 选择 这 个 产生 
式 , 并 构造 出 根 结 点 的 各 个 子 结 点 , 并 使 用 该 产生 式 体 中 的 符号 作为 这 些 子 结 点 的 标号 。 这 棵 语 
法 分 析 树 的 这 次 扩展 如 图 2-18b 所 示 。 

在 图 2-18 所 示 的 三 个 快照 中 , 都 包含 一 个 指向 输入 串 中 向 前 看 符号 的 箭头 和 一 个 指向 当前 
正 被 考虑 的 语法 分 析 树 结 点 的 箭头 。 一 旦 一 个 结 点 的 子 结 点 全 部 构造 完毕 , 我们 就 要 考虑 该 结 
点 的 最 左 子 结 点 。 在 图 2-18b 中 , 根 结 点 的 子 结 点 刚刚 构造 完毕 ,下 一 个 要 考虑 的 结 点 是 标号 为 
for 的 最 左 子 结 点 。 








stmt > expr ; 
if ( expr ) stmi 
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图 2-18 ”从 左 到 右 扫 描 输 入 串 时 进行 的 自 顶 向 下 语法 分 析 


如 果 当 前 正 考虑 的 语法 分 析 树 结 点 的 标号 是 一 个 终结 符号 , 而 且 此 终结 符号 与 向 前 看 符号 
匹配 , 那么 语法 分 析 树 的 箭头 和 输入 的 箭头 都 前 进一步 。 输 入 中 的 下 一 个 终结 符 成 为 新 的 向 前 
看 符号 ,同时 考虑 语法 分 析 树 的 下 一 个 子 结 点 。 在 图 2-18c 中 , 语法 分 析 树 的 箭头 指向 根 的 下 一 
个 子 结 点 , 输入 中 的 箭头 已 经 前 进 到 下 一 个 终结 符号 , 即 *(”。 再 下 一 步 将 使 得 语法 分 析 树 的 箭 
头 指向 标号 为 非 终结 符号 optexpr 的 子 结 点 , 并 将 输入 的 箭头 指向 终结 符号 “;”。 

在 标号 为 optexpr 的 非 终 结 符号 结 点 上 , 我 们 需要 再 次 为 一 个 非 终结 符号 选择 产生 式 。 以 < 
为 体 的 产生 式 ( 即 e 产生 式 ) 需 要 特殊 处 理 。 当 前 , 我 们 将 e 产生 式 当 作 上 默认 选择 ， 只 有 在 没有 其 
他 产生 式 可 用 时 才 会 选择 它们 。 我 们 将 在 2.4. 3 节 中 再 次 讨论 e 产 生 式 。 对 于 非 终结 符号 optexpr 
和 向 前 看 符号 “; ”, 我 们 使 用 optexpr H e 产生 式 , 因为 “; ”和 optexpr 仅 有 的 另 一 个 产生 式 不 匹 
配 , 那个 产生 式 的 体 是 终结 符号 expr。 

一 般 来 说 , 为 一 个 非 终结 符号 选择 产生 式 是 一 个 “尝试 并 犯错 ”的 过 程 。 也 就 是 说 , 我 们 首 
先 选 择 一 个 产生 式 , 并 在 这 个 产生 式 不 合适 时 进行 回溯 , 再 尝试 另 一 个 产生 式 。 一 个 产生 式 “ 不 
合适 ”是 指使 用 了 该 产生 式 之 后 , 我 们 无 法 构造 得 到 一 棵 与 当前 输入 串 相 匹配 的 语法 分 析 树 。 但 
是 在 称 为 预测 语法 分 析 的 特殊 情形 下 不 需要 进行 回 湖 。 我 们 接 下 来 将 讨论 这 个 方法 。 

2.4.2 预测 分 析 法 | 

递归 下 降 分 析 方 法 (recursive-descent parsing) 是 一 种 自 顶 向 下 的 语法 分 析 方 法 , 它 使 用 一 组 
递归 过 程 来 处 理 输 入 。 文 法 的 每 个 非 终 结 符 都 有 一 个 相关 联 的 过 程 。 这 里 我 们 考虑 递归 下 降 分 
析 法 的 一 种 简单 形式 , 称 为 预测 分 析 法 (predictive parsing) 。 在 预测 分 析 法 中 , 各 个 非 终 结 符号 对 
应 的 过 程 中 的 控制 流 可 以 由 向 前 看 符号 无 二 义 地 确定 。 在 分 析 输 入 串 时 出 现 的 过 程 调用 序列 隐 
式 地 定义 了 该 输入 串 的 一 棵 语法 分 析 树 。 如 果 需 要 , 还 可 以 通过 这 些 过 程 调用 来 构建 一 个 显 式 
的 语法 分 析 树 。 
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图 2-19 的 预测 分 析 器 包含 了 两 个 过 程 stmt( ) 和 optexpr() , 分别 对 应 于 图 2-16 中 文法 的 非 终 
结 符号 stmt 和 optexpr。 该 分 析 器 还 包括 一 个 额外 的 过 程 matech。 这 个 额外 过 程 用 来 简化 seme 和 
optexpr 的 代码 。 过 程 matich(1) 将 它 的 参数 ¢ 和 向 前 看 符号 比较 , 如 果 匹 配 就 前 进 到 下 一 个 输入 终结 
符号 。 因 此 , match 改变 了 全 局 变量 lookhead 的 值 , 该 变量 存储 了 当前 正 被 扫描 的 输入 终结 符号 。 


void stmt() { 

switch ( lookahead ) { 

case expr: 
match(expr); match(';'); break; 

case if 
match(if); match(‘('); match(expr); match(‘)'); stmt(); 
break; 

case for: 
match(for); match('('); 
opteapr(); match(';'); optexpr(); match(';'); opteapr(); 
match(')'); stmt(); break; 

case other; 
match(other); break; 

default: 
report("syntax error"); 








} 

void epterpr() { 
if ( lookahead == expr ) match(expr); 

} 

void match(terminal 1) { 
if ( lookahead == t ) lookahead = nextTerminal; 
else report("“syntax error"); 

} 





图 2-19 一 个 预测 分 析 器 的 伪 代 码 
分 析 过 程 开始 时 , 首先 调用 文法 的 开始 非 终结 符号 some 对 应 的 过 程 。 在 处 理 如 图 2-18 所 示 
的 输入 时 ,lookhead 被 初始 化 为 第 一 个 终结 符号 for。 过 程 seme 执行 和 如 下 产生 式 对 应 的 代码 : 
stmt — for ( optexpr ; optexpr ; optexpr ) stmt 
在 对 应 于 该 产生 式 体 的 代码 中 一 一 即 图 2-19 的 过 程 stmt 中 处 理 for 语句 的 case 分 支 一 一 每 
个 终结 符 都 和 向 前 看 符号 匹配 ， 而 每 个 非 终结 符 都 产生 一 个 对 相应 过 程 的 调用 : 
match(for) ; match('('); 
optexpr(); match('; '); optexpr(.); match('; ') ; optexpr(); 
match(')'); simt(); 
预测 分 析 需 要 知道 哪些 符号 可 能 成 为 一 个 产生 式 体 所 生成 串 的 第 一 个 符号 。 更 精确 地 说 , > a 
是 一 个 文法 符号 (终结 符号 或 非 终结 符号 ) 捉 。 我 们 将 FIRST(a) 定义 为 可 以 由 a 生成 的 一 个 或 多 
个 终结 符号 串 的 第 一 个 符号 的 集合 。 如 果 a 就 是 e 或 者 可 以 生成 e, 那么 e 也 在 FIRST(a) 中 。 
关于 计算 FIRST(a) 的 算法 的 详细 描述 将 在 4. 4. 2 节 中 给 出 。 这 里 , 我 们 将 使 用 不 具 一 般 性 
的 推导 方法 来 求 出 FIRST(a) 中 的 符号 。 通 常情 况 下 , a 要 么 以 一 个 终结 符号 开头 ， 此 时 该 终结 
符号 就 是 FIRST(a) 中 的 唯一 符号 ; 要 么 a 以 一 个 非 终结 符号 开头 , 且 该 非 终结 符 的 所 有 产生 式 
体 都 以 某 个 终结 符号 开头 ,那么 这 些 终结 符号 就 是 FIRST(a) 的 所 有 成 员 。 
例如 ,对 于 图 2-16 中 的 文法 , 其 FIRST 的 正确 计算 如 下 : 
FIRST(stm:) = {expr, if, for, other} 
FIRST( expr ; ) = {expr} 
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如 果 有 两 个 产生 式 Aa 和 4 一 8, 我 们 就 必须 考虑 相应 的 FIRST 集合。 如 果 我 们 不 考虑 e 产 
生 式 , 预测 分 析 法 要 求 FIRST(a) 和 TIRST(B8) 不 相交 , 那么 就 可 以 用 向 前 看 符号 来 确定 应 该 使 用 


FA Bo 
2.4.3 何 时 使 用 e 产生 式 

我 们 的 预测 分 析 器 在 没有 其 他 产生 式 可 用 时 , 将 se 产 生 式 作为 默认 选择 使 用 。 处 理 图 2-18 
所 示 的 输入 时 , 在 终结 符号 for 和 “ ("匹配 之 后 , 向 前 看 符号 为 *; ”。 此 时 , 过程 optexpr 被 调用 ， 
其 过 程 体 中 的 代码 : 

if ( lookahead == expr ) match( expr) ; 

被 执行 。 非 终结 符号 optexpr 有 两 个 产生 式 , 它们 的 体 分 别 是 expr Me. WHATS"; "与 终结 
符号 expr 不 匹配 , 因此 不 能 使 用 以 expr 为 体 的 产生 式 。 事 实 上 , 该 过 程 没有 改变 向 前 看 符号 ， 
也 没有 做 任何 其 他 操作 就 返回 了 。 不 做 任何 操作 就 对 应 于 应 用 es 产生 式 的 情形 。 

对 于 更 加 一 般 化 的 情况 , 我 们 考虑 图 2-16 中 产生 式 的 一 个 变 体 ， 其 中 optexpr 生成 一 个 表达 
式 非 终结 符号 ， 而 不 是 终结 符号 expr: 


optexpr — expr 





| e 

这 样 optexpr 要 么 使 用 非 终结 符号 expr 生成 一 个 表达 式 , BAER co TEXT optexpr 进行 语法 
分 析 时 ， 如 果 向 前 看 符号 不 在 FIRST (expr) 中, 我 们 就 使 用 6 产生 式 。 

要 更 加 深入 地 了 解 应 该 在 何 时 使 用 6 产生 式 , 请 参见 4.4.3 节 中 关于 LL(1) 文 法 的 讨论 。 
2.4.4 设计 一 个 预测 分 析 器 

我 们 可 以 将 2.4. 2 节 中 非 正 式 介绍 的 技术 推广 应 用 到 任意 具有 如 下 性 质 的 文法 上 : 对 于 文法 
的 任何 非 终 结 符号 , 它 的 各 个 产生 式 体 的 FIRST 集合 互 不 相交 。 我 们 还 将 看 到 ， 如 果 我 们 有 一 个 
翻译 方案 , 即 一 个 增加 了 语义 动作 的 文法 , 那么 我 们 可 以 将 这 些 语义 动作 当 作 此 语法 分 析 器 的 过 
程 的 一 部 分 执行 。 

回顾 一 下 , 一 个 预测 分 析 器 ( predictive parser) 程序 由 各 个 非 终 结 符 对 应 的 过 程 组 成 。 对 应 于 
非 终 结 符 4 的 过 程 完成 以 下 两 项 任务 : 

1) 检查 向 前 看 符号 , 决定 使 用 4 的 哪个 产生 式 。 如 果 一 个 产生 式 的 体 为 a( 这 里 a DERE 
e) 且 向 前 看 符号 在 FIRST(a) 中, 那么 就 选择 这 个 产生 式 。 对 于 任何 向 前 看 符号 , 如 果 两 个 非 空 的 
- 产生 式 体 之 间 存 在 冲突 , 我 们 就 不 能 对 这 种 文法 使 用 预测 语法 分 析 。 另 外 , 如果 AA e FER, 那 
么 只 有 当 向 前 看 符号 不 在 A 的 其 他 产生 式 体 的 FIRST 集合 中 时 , 才 会 使 用 4 的 < 产生 式 。 

2) 然后 , 这 个 过 程 模拟 被 选中 产生 式 的 体 。 也 就 是 说 ,从 左边 开始 逐个 “执行 "此 产生 式 体 
中 的 符号 。“ 执行 ”一 个 非 终 结 符号 的 方法 是 调用 该 非 终 结 符号 对 应 的 过 程 , 一 个 与 向 前 看 符号 
匹配 的 终结 符号 的 “执行 "方法 则 是 读 入 下 一 个 输入 符号 。 如 果 在 某 个 点 上 , 产生 式 体 中 的 终结 
符号 和 向 前 看 符号 不 匹配 , 那么 语法 分 析 器 就 会 报告 一 个 语法 错误 。 

图 2-19 显示 的 是 对 图 2-16 的 文法 应 用 这 些 规则 的 结果 。 

就 像 通过 扩展 文法 来 得 到 一 个 翻译 方案 一 样 , 我 们 也 可 以 扩展 一 个 预测 分 析 器 来 获得 一 个 
语法 制导 的 翻译 器 。 在 5.4 节 中 将 给 出 一 个 能 够 达到 此 目的 的 算法 。 下 面 的 部 分 构造 方法 已 经 
可 以 满足 当前 的 要 求 : 

1) 先 不 考虑 产生 式 中 的 动作 , 构造 一 个 预测 分 析 器 。 

2) 将 翻译 方案 中 的 动作 拷贝 到 语法 分 析 器 中 。 如 果 一 个 动作 出 现在 产生 式 p 中 的 文法 符号 
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XHAR, 则 该 动作 就 被 找 册 到 的 代码 中 站 的 实现 之 后 。 否 则 ， 如果 该 动作 出 现在 一 个 产生 式 
的 开头 , 那么 它 就 被 拷贝 到 该 产生 式 体 的 实现 代码 之 前 。 

我 们 将 在 2. 5 节 构 造 这 样 一 个 翻译 器 。 
2.4.5 左 递归 

递归 下 降 语法 分 析 器 有 可 能 进入 无 限 循环 。 当 出 现 如 下 所 示 的 “ 左 递归 "产生 式 时 ,分 析 器 
就 会 出 现 无 限 循环 : 

expr —> expr + term 

在 这 里 , 产生 式 体 的 最 左边 的 符号 和 产生 式 头 部 的 非 终结 符 相 同 。 假 设 expr 对 应 的 过 程 决定 使 
用 这 个 产生 式 。 因 为 产生 式 体 的 开头 是 expr, 所 以 expr 对 应 的 过 程 将 被 递归 调用 。 由 于 只 有 当 产 
生 式 体 中 的 一 个 终结 符号 被 成 功 匹 配 时 ,向 前 看 符号 才 会 发 生 改 变 , 因此 在 对 expr 的 两 次 调用 之 
间 输 入 符号 没有 发 生 改 变 。 结 果 , 第 二 次 expr 调用 所 做 的 事情 与 第 一 次 调用 所 做 的 完全 相同 ， 这 
意味 着 会 对 expr 进行 第 三 次 调用 , 并 不 断 重 复 , 进入 无 限 循环 。 

通过 改写 有 问题 的 产生 式 就 可 以 消除 左 递归 。 考 虑 有 两 个 产生 式 : 

A— Aa | B 
的 非 终 结 符 号 4, Rho AB BRA 开头 的 终结 符号 / 非 终 结 符号 的 
序列 。 例 如 , 在 产生 式 
expr — expr + term | term 

H, 非 终结 符号 4 =expr, Has + term, {B= tem, 

六 为 产生 式 4 一 ha 的 右 部 的 最 左 符号 是 4 自身 , 非 终 结 符号 4 
和 它 的 产生 式 就 称 为 左 递归 的 (left recursive) O. ANTAL ARC PPS ER 
将 在 4 的 右边 生成 一 个 a 的 序列 ， 如 图 2-20a 所 示 。 当 4 RARER 
为 B 时, 我 们 就 得 到 了 一 个 在 B 后 跟 有 0 个 或 多 个 a 的 序列 。 A 

如 图 2-20b 所 示 , 使 用 一 个 新 的 非 终结 符号 R, 并 按照 如 下 方式 改 i 
写 4 的 产生 式 可 以 达到 同样 的 效果 : 

A— BR 
R— oR le 

非 终 结 符号 R 和 它 的 产生 式 R 一 oR Æ Aig a th (right recursive), 
因为 这 个 产生 式 的 右 部 的 最 后 一 个 符号 就 是 尺 本 身 。 如 图 2-20b 所 示 ， L821elel = [als 
右 递归 的 产生 式 会 使 得 树 向 右 下 方向 生长 。 因 为 树 是 向 右 下 生长 的 ,对 b) 
包含 了 左 结合 运算 符 ( 比如 减法 ) 的 表达 式 的 翻译 就 变 得 较为 困难 。 然 图 2-20 生成 一 个 串 的 左 递 
而 , 我 们 将 在 2. 5. 2 节 看 到 ， 通过 仔细 设计 翻译 方案 ， 我 们 仍然 可 以 将 一 。” 归 方 式 和 右 递归 方式 
个 表达 式 正确 地 翻译 成 后 缀 表达 式 。 

在 4.3.3 节 , 我 们 将 考虑 更 一 般 的 左 递归 形式 ， 并 说 明 如 何 从 文法 中 消除 左 递归 。 
2.4.6 2.4 节 的 练习 

练习 2. 4. 1: 为 下 列 文法 构造 递归 下 降 语法 分 析 器 : 

1)S—>+S5S1-SSlia 

2)S>S8S(S)Sle 

3)S—0S1101 












































O 在 一 般 的 左 递归 文法 中 ,， 非 终结 符号 4 可 能 通过 一些 中 间 产 生 式 推导 出 4q, 而 不 一 定 存在 产生 式 4 一 Ag。 
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2.5 简单 表达 式 的 翻译 器 

使 用 前 面 三 节 介绍 的 技术 , 现在 我 们 可 以 用 Java 语言 编写 一 个 语法 制导 翻译 器 。 这 个 翻译 
器 可 以 把 算术 表达 式 翻 译 成 等 价 的 后 级 形式 。 为 了 使 最 初 的 程序 比较 小 且 容 易 理解 , 我 们 首先 
处 理 最 简单 的 表达 式 ,， 即 由 二 目 运算 符 加 号 和 减 号 分 隔 的 数位 序列 。 在 2.6 节 中 ，, 我们 将 扩展 这 





个 程序 ,使 它 能 够 翻译 包含 数字 和 其 他 运算 符 的 表达 式 。 由 于 表达 式 是 很 多 程序 设计 语言 中 的 
构造 , 因此 深入 研究 表达 式 的 翻译 问题 是 有 意义 的 。 E 
语法 制导 翻译 方案 常常 作为 翻译 器 的 规约 。 图 2.21( 图 ”| 
2-15 的 重复 ) 中 的 翻译 方案 定义 了 将 要 执行 的 翻译 过 程 。 | term 
在 使 用 一 个 预测 语法 分 析 器 进行 语法 分 析 时 ,我 们 常 tem > o { print(’0") } 
常 需要 修改 一 个 给 定 翻译 方案 的 基础 文法 。 特 别 地 ， be {pant( 3 
图 2-21 中 的 翻译 方案 的 文法 是 左 递归 的 。 如 上 节 所 述 , 预 | 9 { print('9") } 











测 语法 分 析 器 不 能 处 理 左 递归 的 文法 。 

现在 我 们 看 起 来 处 在 矛盾 之 中 : 一 方面 , 我 们 需要 一 ”图 2-21 翻译 为 后 级 表示 形式 的 动作 
个 能 够 支持 翻译 规约 的 文法 ; 另 一 方面 , 我 们 又 需要 一 个 明显 不 同 的 能 够 支持 语法 分 析 过 程 的 文 
法 。 解 决 的 方法 是 首先 使 用 易于 翻译 的 文法 , 然后 再 小 心地 对 这 个 文法 进行 转换 , 使 之 能 够 支持 
语法 分 析 。 通 过 消除 图 221 中 的 左 递归 , 我 们 可 以 得 到 一 个 适用 于 预测 递归 下 降 翻 译 器 的 文法 。 
2.5.1 抽象 语法 和 具体 语法 

设计 一 个 翻译 器 时 ,名 为 抽象 语法 树 (abstract syntax tree) 的 数据 结构 是 一 个 很 好 的 起 点 。 在 一 
个 表达 式 的 抽象 语法 树 中 , 每 个 内 部 结 点 代表 一 个 运算 符 , 该 结 点 的 子 结 点 代表 这 个 运算 符 的 运算 
分 量 。 对 于 更 加 一 般 化 的 情况 ， 当 我 们 处 理 任意 的 程序 设计 语言 构造 时 , 我 们 可 以 创建 一 个 针对 这 
个 构造 的 运算 符 , 并 把 这 个 构造 的 具有 语义 信息 的 组 成 部 分 作为 这 个 运算 符 的 运算 分 量 。 

9 -5+2 的 抽象 语法 树 如 图 2-22 所 示 , 其 中 根 结 点 代表 运算 符 +， 根 结 点 的 子 树 分 别 代 表 
子 表达 式 9 -5 和 2。 将 9 -5 组 成 一 个 运算 分 量 反映 了 在 对 优先 级 相同 的 运算 符 求 值 时 , 求 值 
顺序 总 是 从 左 到 右 的 。 因 为 + 和 -具有 相同 的 优先 级 , 因此 9 -5 +2 等 价 于 (9 -5) +2。 

抽象 语法 树 也 简称 语法 树 ( syntax tree), 在 某 种 程度 上 和 语法 分 析 树 相似 。 但 是 在 抽象 语法 
树 中 , 内 部 结 点 代表 的 是 程序 构造 ; 而 在 语法 分 析 树 中 , 内 部 结 点 代表 的 是 非 终结 符号 。 文 法 中 
的 很 多 非 终结 符号 都 代表 程序 的 构造 , 但 也 有 一 部 分 是 各 种 各 样 的 辅助 符号 ， 比 如 那些 代表 项 、 
因子 或 其 他 表达 式 变 体 的 非 终结 符号 。 在 抽象 语法 树 中 , 通常 不 需要 这 些 辅助 符号 , 因此 会 将 这 
些 符号 省 略 掉 。 为 了 强调 它们 之 间 的 区 别 , 我 们 有 时 把 语法 分 析 树 称 为 具体 语法 树 ( concrete syn- 


tax tree) ， 而 相应 的 文法 称 为 该 语言 的 具体 语法 (concrete syntax) o 十 
在 图 2-22 给 出 的 语法 树 中 ,每 个 内 部 结 点 都 和 一 个 运算 符 关 联 。 有 
树 中 没有 对 应 于 expr 一 term 这 样 的 单产 生 式 ( 即 产生 式 体 中 仅 包 含 一 N 
个 非 终结 符号 的 产生 式 ) 的 “辅助 " 结 点 , 也 没有 对 应 于 e 产生 式 (比如 j 
reste) 的 结 点 。 图 2-22 9 -5+2 的 语法 树 


我 们 希望 翻译 方案 的 基础 文法 的 语法 分 析 树 与 抽象 语法 树 尽 可 能 相近 。 图 2-21 中 的 文法 对 
子 表达 式 进 行 分 组 的 方式 与 语法 树 的 分 组 方式 相似 。 例 如 , 加 运算 符 的 子 表达 式 是 由 产生 式 体 
expr + tern 中 的 expr 和 term 给 出 的 。 
2.5.2 调整 翻译 方案 

图 2-20 中 简 述 的 左 递归 消除 技术 同样 可 以 应 用 于 包含 了 语义 动作 的 产生 式 。 首 先 ,该 技术 
被 扩展 到 4 的 多 个 产生 式 中 。 在 我 们 的 例子 中 , 4 就 是 epr, 它 有 两 个 expr 的 左 递归 产生 式 和 一 
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个 非 左 递归 的 产生 式 。 这 个 技术 将 产生 式 AS Aa! AB 1 y 转换 成 
A—yR 
RoR! BR | e 
其 次 , 我 们 要 转换 的 产生 式 不 仅 包含 终结 符号 和 非 终结 符号 , BUERE. WHAENE 
式 中 的 语义 动作 在 转换 时 被 当 作 终 结 符号 直接 进行 复制 。 
UAR 考虑 图 2-21 中 的 翻译 方案 。 令 





A= expr 
a= + term{print(’ +’) } 
B= - term|print(’-')} 
y= term 


那么 进行 左 递 归 消 除 转换 后 将 产生 如 图 223 所 示 的 翻译 方案 。 图 2-21 中 的 expr 产生 式 已 经 转换 
成 expr 和 新 非 终结 符号 rest 的 产生 式 , 其 中 rest HIT ROA. term 的 产生 式 就 是 图 2-21 中 











term 的 产生 式 。 图 2-24 展示 了 使 用 图 2-23 中 的 文法 对 9 - 5 + 2 进行 翻译 的 过 程 。 口 

expr — term rest P EN 

rest —> + term { print('+’) } rest term rest . 
| -term { print('-') } rest \ Sa 
T- 9 {print('9')} š term {print(‘-‘)} rest 、 

term > 0 { print(‘0’) } xe ee 
| 1 { print('1’) } 5 {print(5)} + term {print(‘+’)} rest 
| 9 { print(’9') } 9 {print(’2')} ‘ 

图 2-23 ”消除 左 递归 后 的 翻译 方案 图 224 从 9 -5+2 到 95-2+ 的 翻译 





左 递归 消除 的 工作 必须 小 心 进 行 ， 以 确保 消除 后 的 结果 保持 语义 动作 的 顺序 。 例 如 , 在 图 2-23 
的 翻译 方案 中 , 动作 | print('+') | Mf print(’ -') | 都 处 于 产生 式 体 的 中 间 ，, 两 边 分 别 是 非 终结 符号 
term 和 rest。 假 如 将 这 个 动作 放 到 产生 式 的 末尾 , 即 rest 之 后 , 那么 这 个 翻译 就 是 不 正确 的 。 请 读者 
自己 证 明 , 假如 这 么 做 , 9 - 5 +2 就 会 被 错误 地 转换 成 952 +-, 它 是 9 - (5 +2) 的 后 缀 表示 方 
A; 而 我 们 实际 想 要 的 是 952 +-, 即 (9 -5)+2 的 后 缀 表示 方式 。 
2.5.3 非 终 结 符号 的 过 程 

2-25 中 的 函数 expr, term 和 rest 实现 了 图 2-23 中 的 语法 制导 翻译 方案 。 这 些 函 数 模拟 了 对 
应 于 非 终结 符号 的 各 个 产生 式 体 。 函 数 expr 先 调 用 term( ) 再 调用 rest( ) ,从 而 实现 产生 式 expr 一 
term rest, 

PRI rest 实现 了 图 2-23 中 非 终结 符 rest 的 三 个 产生 式 。 如 果 向 前 看 符号 是 加 号 , 这 个 函数 就 
使 用 第 一 个 产生 式 ; 如 果 向 前 看 符号 是 减 号 , 就 使 用 第 二 个 产生 式 ; 在 其 他 情况 下 使 用 产生 式 
rest 一 e。 非 终结 符号 rest 的 前 两 个 产生 式 是 用 过 程 rest 中 这 语 名 的 前 两 个 分 支 实 现 的 。 如 果 向 前 
看 符号 是 + , 就 调用 match(' + ') 来 匹配 它 。 在 调用 term( ) 之 后 ,相应 的 语义 动作 通过 输出 一 个 
加 号 来 实现 。 第 二 个 产生 式 与 此 类 似 , 只 是 用 - 代替 + 。 央 为 rest 的 第 三 个 产生 式 的 右 部 是 e， 
所 以 函数 rest 中 最 后 一 个 else 子 句 不 做 任何 处 理 。 

非 终结 符号 term 的 十 个 产生 式 生成 十 个 数位 。 因 为 每 一 个 产生 式 都 生成 一 个 数位 并 打印 ， 
所 以 在 图 2-25 中 用 相同 的 代码 实现 这 些 产生 式 。 如 果 term( ) 中 的 条 件 表达 式 成 立 , 变量 上 中 就 
保存 lookahead 代表 的 数位 ， 它 将 在 调用 完 match 之 后 被 打印 出 来 。 注 意 ,match 会 改变 向 前 看 符 
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号 ， 所 以 我 们 需要 上 保存 这 个 数位 ,以 使 稍 后 打印 输出 号。 





void ezpr() { 
term(); rest(); 
} 


void rest() { 
if ( lookahead == '+' ) { 
match('+'); term(); print('+'); rest(); 
else if ( lookahead == 一 ) { 
match(‘~'); term(); print('-‘); rest(); 


} 
else { } /* 不 对 得 入 作 任何 处 理 * / ; 


void term() { 
if ( lookahead 是 一 个 数位 ) { 
t= lookahead; match(lookahead); print(t); 
} 


else report( "语法 错误 "); 











图 2-25 非 终 结 符 expr rest 和 term 的 伪 代 码 

2.5.4 ”翻译 器 的 简化 

在 给 出 完整 的 程序 之 前 , 我 们 将 对 图 2-25 中 的 代码 做 两 处 简化 。 这 个 简化 将 把 过 程 rest 展开 到 过 
epr 中 。 在 翻译 具有 多 个 优先 级 的 表达 式 时 , 这 样 的 简化 处 理 可 以 减少 需要 使 用 的 过 程 数 目 。 

首先 , 某 些 递归 调用 可 以 被 蔡 换 为 迭代 。 如 果 一 个 过 程 体 中 执行 的 最 后 一 条 语句 是 对 该 过 
程 的 递归 调用 , 那么 这 个 调用 就 称 为 是 足 递 归 的 (tail recursive), PM, 在 函数 rest 中 ， 当 向 前 看 
符号 为 + 和 -时 对 rest() 的 调用 都 是 尾 递归 的 。 因 为 在 每 个 分 支 中 , 对 rest 的 递归 调用 都 是 调用 
rest 时 执行 的 最 后 一 条 语句 。 

对 于 没有 参数 的 过 程 ,一 个 尾 递 归 调 用 可 以 被 蔡 换 为 跳 转 到 过 程 开头 的 语句 。 过 程 rest 的 代码 
可 以 被 改写 为 图 2-26 中 的 伪 代 码 。 只 要 向 前 看 符号 是 一 个 加 号 或 一 个 减 号 , 过 程 rest 就 和 该 符号 匹 
Bc, 并 调用 term 来 匹配 一 个 数位 , 然后 重复 这 一 过 程 。 否 则 , 它 就 跳出 while 循环 并 从 rest 返回 。 








void rest() { 
while( true ) { 
if( lookahead == '+' ) { 
match('+'); term(); print( +); continue; 


else if ( lookahead == '~' ) { 
match('-'), term(); print('-'): continue; 
} 


break ; 











2-26 ”消除 图 2-25 中 过 程 rest 的 尾 递归 
其 次 , 整个 Java 程序 还 包含 另 一 处 修改 。 一 旦 图 2-25 中 rest at EY FEB ADA RAE 
代 过 程 , 那么 对 rest 的 调用 仅仅 出 现在 过 程 expr 中 。 因 此 , 将 过 程 expr 中 对 rest 的 调用 替换 为 rest 
的 过 程 体 , 就 可 以 将 这 两 个 函数 合 二 为 一 。 





O 作为 一 个 小 小 的 优化 , 我 们 可 以 在 调用 match 之 前 打印 这 个 数位 ,避免 将 这 个 数位 保存 起 来 。 一 般 来 说 , 改变 语 
义 动作 和 文法 符号 之 间 的 顺序 是 有 风险 的 , 因为 这 么 做 可 能 改变 这 个 翻译 的 结果 。 
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2. 5.5 完整 的 程序 

我 们 的 翻译 器 的 完整 Java 程序 显示 在 图 2-27 中 。 第 一 行 以 import 开头 ,使 得 程序 可 以 访 
问 java. io 包 以 进行 系统 输入 和 和 输出。 其余 的 代码 包括 两 个 类 : Parser Ml Postfix, # Par- 
ser 包含 变量 lookahead 和 图 数 Parser, expr, term Al match, 








import java.io.*; 
class Parser { 
static int lookahead; 


public Parser() throws I0Exception { 
lookahead = System.in.read(); 


} 
void expr() throws I0Exception { 
term(); 
while(true) { 
if( lookahead == '+' ) { 
match('+'); term(); System.out.write('t+'); 
} 
else if( lookahead == '-' ) { 
match('-'); term(); System.out.write('-'); 
} 


else return; 


} 


void term() throws I0Exception { 
if( Character.isDigit((char)lookahead) ) { 
System.out.write((char) lookahead); match(lookahead) ; 
} 
else throw new Error ("syntax error"); 


} 





void match(int t) throws IOException { 
if( lookahead == t ) lookahead = System.in.read(); 
else throw new Error("syntax error"); 


3} 


public class Postfix { 
public static void main(String[] args) throws IOException { 
Parser parse = new Parser(); 
parse.expr(); System.out.write('\n'); 





图 2-27 KPA a ATEN Java 程序 


程序 的 执行 从 类 Post fix 中 定义 的 函数 main 开始 。 函 数 main 创建 了 一 个 Parser 类 的 
实例 parse， 然 后 调用 它 的 函数 expr 对 一 个 表达 式 进行 语法 分 析 。 

和 类 Parser 同名 的 函数 Parser 是 该 类 的 构造 函数 (constructor) , 它 在 创建 该 类 的 一 个 对 
象 时 自动 调用 。 请 注意 , 根据 类 Parser 开始 处 的 定义 , 构造 函数 Parser 读 人 一 个 词法 单元 ， 
并 将 变量 lookahead 初始 化 为 这 个 词法 单元 。 由 单个 字符 组 成 的 词法 单元 是 由 系统 输入 例 程 
read 提供 的 ,该 子 程序 从 输入 文件 中 读 取 下 一 个 字符 。 注 意 ， lcokahead 被 声明 为 整 型 变量 ， 
而 不 是 字符 型 变量 。 这 是 为 了 便于 在 后 面 引 入 非 单个 字符 的 其 他 词法 单元 。 

函数 expr 是 2. 5.4 节 中 讨论 的 简化 处 理 的 结果 。 它 实现 了 图 223 中 的 非 终结 符号 expr 和 
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rest, El 2-27 中 expr 的 代码 首先 调用 term, 然后 用 一 个 while 循环 不 断 测试 Lookahead BA 
和 + 或 -匹配 。 当 运行 到 代码 中 的 return 语句 时 , 控制 流离 开 这 个 while 循环 。 在 循环 内 部 ， 
system 类 的 输入 /输出 功能 用 来 写 一 个 字符 。 

函数 term 使 用 Java 类 Character 中 的 例 程 isDigit 来 判断 向 前 看 符号 是 否 为 一 个 数位 。 
例 程 isDigit 的 参数 是 一 个 字符 。 然 而 , 为 了 方便 将 来 的 扩展 ，lookanead 被 声明 为 整 型 变 
量 。(char)lookahead 将 1ookahead 的 类 型 强制 转化 (cast) 为 字符 。 和 图 2-25 H, 这 里 有 
一 个 小 的 改动 , 即 输出 向 前 看 字符 的 语义 动作 在 调用 match 之 前 就 执行 了 。 

函数 mach 检查 终结 符号 。 如 果 向 前 看 符号 是 匹配 的 , 它 就 读 取 下 一 个 输入 终结 符号 , 否则 
它 执行 下 面 的 代码 , 发 出 出 错 消息 。 


throw new Error("syntax error") ; 


上 述 代码 创建 了 类 Error 的 一 个 新 异常 , 并 将 “syntax error” 作 为 其 错误 消息 。jJava 并 不 强制 
要 求 在 throw 子 句 中 声明 Error 异常 , 因为 这 些 异常 的 本 意 是 表示 不 应 该 发 生 的 不 正常 事件 ,9 














l Java 的 一 些 主要 特征 | 

对 于 不 熟悉 Java 的 读者 来 说 , 下 面 的 一 些 注 解 有 助 于 他 们 阅读 图 2-27 中 的 代码 : 

o — Java 的 类 由 变量 和 函数 定义 的 序列 组 成 。 

o 函数 ( 例 程 ) 的 参数 列表 用 括号 括 起 来 , 即使 没有 参数 也 需要 写 出 括号 , 因此 我 们 写成 
expr() 和 term( )。 这 些 函 数 实际 上 是 过 程 ,因为 它们 的 函数 名 字 前 面 的 关键 字 
void 表示 它们 没有 返回 值 。 

© 函数 之 间 通 信 时 可 以 通过 * 值 传递 方式 ”传递 参数 ,也 可 以 通过 访问 共享 数据 进行 通 
信 。 比 如 , 函数 expr() 和 term( ) 使 用 类 变量 lookahead 来 检查 向 前 看 符号 。 这 
两 个 函数 都 可 以 访问 这 个 类 变量 ,因为 它们 间 属 于 类 Parser, 

e 和 C 语言 一 样 ,Java 语言 使 用 = 表示 赋值 , == 表示 等 于 ,1= 表示 不 等 于 。 

e term( ) 定 义 中 的 子 句 “throw IORxception"” 声 明 该 函数 在 执行 时 可 能 会 出 现 一 个 
名 为 IOException 的 异常 。 当 函数 match 调用 例 程 read 时 ,如 果 元 法 读 到 输入 就 
会 出 现 这 样 的 异常 。 任 何 调用 了 match 的 函数 也 必须 声明 在 该 函数 运行 时 可 能 出 现 


| 一 个 IOException 异常 。 














2.6 词法 分 析 


一 个 词法 分 析 器 从 输入 中 读 取 字符 , 并 将 它们 组 成 “词法 单元 对 象 *。 除 了 用 于 语法 分 析 的 
终结 符号 之 外 , 一 个 词法 单元 对 象 还 包含 一 些 附加 信息 , 这 些 信息 以 属性 值 的 形式 出 现 。 至 今 为 
tk, 我 们 还 不 需要 区 分 术语 “词法 单元 ”和 “终结 符号 ”"， 因为 语法 分 析 器 忽略 了 词法 单元 中 带 有 








O 错误 处 理 可 以 使 用 Java 的 异常 处 理 机 制 来 实现 。 方 法 之 一 是 声明 一 个 扩展 了 系统 类 Exception 的 新 的 异常 ， 比 
如 SyntaxError。 然 后 在 term 或 match 中 检测 到 错误 时 皂 出 SyntaxError 异常 ,而 不 是 Error 异常 。 然 后 
在 main 中 把 对 parse. expr() 的 调用 放 在 一 个 try 语句 中 。 该 try 语句 可 以 捕获 Synt axError AW, 输出 
一 个 消息 并 结束 。 如 果 这 么 做 , 我 们 将 需要 在 图 2-27 的 程序 中 加 入 一 个 类 SyntaxError。 要 完成 这 个 扩展 , 我 
们 还 必须 修改 match 和 term 的 声明 , 使 得 它们 不 仅 可 以 抛 出 IOException, 还 可 以 抛 出 SyntaxError, F 
时 也 必须 重新 声明 调用 它们 的 函数 expr, 使 得 它 可 以 抛 出 SyntaxError 异常 。 
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的 属性 值 。 在 本 节 中 ， 一 个 词法 单元 就 是 一 个 带 有 附加 信息 的 终结 符号 。 
构成 一 个 词法 单元 的 输入 字符 序列 称 为 词素 (lexem) 。 因 此 ,我 们 可 以 说 , 词法 分 析 器 使 得 
语法 分 析 器 不 需要 考虑 词法 单元 的 词素 表示 方式 。 | 





expr — erpr + term { print(’+’) } 

本 节 的 词法 分 析 器 允许 在 表达 式 中 出 现 数字 、 | expr-term {print(‘-’)} 
标识 符 和 “空白 "(空格 、 制 表 符 和 换行 符 )。 它 可 | term 
以 用 于 扩展 上 一 节 中 介绍 的 表达 式 翻 译 器 。 要 人 允 term = terms factor { print('*’) } 
许 在 表达 式 中 出 现 数字 和 标识 符 , 就 必须 扩展 图 oe REES 
2-21 中 的 表达 式 文 法 。 借 此 机 会 我 们 还 将 使 扩展 
后 的 文法 支持 乘法 和 除法 运算 。 扩展 后 的 翻译 方 oe i ed { print(num.value) } 
案 如 图 2-28 所 示 。 | id { print(id.lereme) } 





在 图 2-28 中 , 假定 终结 符号 nm 具有 属性 
num. value ， 该 属性 给 出 了 对 应 于 nom 的 本 次 出 现 
的 整数 值 。 终 结 符号 id 有 一 -个 值 为 字符 串 类 型 的 属性 ,写作 id. jexeme。 我 们 假设 这 个 字符 串 就 
是 这 个 证实 例 的 实际 词素 。 

在 本 节 结 束 时 ,这些 被 用 来 演示 词法 分 析 器 的 工作 方式 的 伪 代 码 片段 将 被 组 合成 Java 代码 。 
本 节 中 介绍 的 方法 适合 于 手写 的 词法 分 析 器 。3. 5 节 描述 了 一 个 可 根据 一 个 词法 规范 生成 词法 分 
析 器 的 工具 Lex。 用 于 保存 标识 符 相关 信息 的 符号 表 或 数据 结构 将 在 2.7 节 中 讨论 。 

2. 6. 1 剔除 空白 和 注释 

2.5 节 的 表达 式 翻 译 器 读 取 输 入 中 的 每 个 字符 ,所 以 任何 无 关 字 符 ， 比 如 空格 , 都 会 使 它 运 
行 失 败 。 大 部 分 语言 允许 词法 单元 之 间 出 现任 意 数 量 的 空白 。 在 语法 分 析 过 程 中 同样 会 忽略 源 
程序 中 的 注释 , 所 以 这 些 注释 也 可 以 当 作 空白 处 理 。 

如 果 词 法 分 析 器 消除 了 空白 , 那么 语法 分 析 器 就 不 必 再 考虑 它们 了 。 当 然 , 也 可 以 修改 文法 使 
得 语法 中 包含 空白 , 但 是 实现 这 个 方法 远 非 易 事 。 

图 2-29 中 的 伪 代 码 在 遇 到 空格 、 制 表 符 或 换行 
符 时 不 断 读 取 输 入 字符 ， 从 而 跳 过 了 空白 部 分 。 变 
量 peck 存放 了 下 一 个 输入 字符 。 在 错误 消息 中 加 入 |) 
行 导 和 上 下 文 有 助 于 定位 错误 。 这 个 代码 使 用 变量 
Line 统计 输入 中 的 换行 符 个 数 。 图 2-29” 跳 过 空白 部 分 
2.6.2 Ws 

在 决定 向 语法 分 析 器 返回 哪个 词法 单元 之 前 , 词法 分 析 器 可 能 需要 预先 读 入 一 些 字 符 。 例 
如 ，C 或 Java 的 词法 分 析 器 在 遇 到 字符 > 之 后 必须 预先 读 人 一 个 字符 。 如 果 下 一 个 字符 是 =, 那 
么 > 就 是 字符 序列 >= 的 一 部 分 ,这 个 序列 是 代表 “大 于 等 于 "运算 符 的 词法 单元 的 词素 。 否 则 > 
本 身 形成 了 “大 于 "运算 符 , 词法 分 析 器 就 多 读 了 一 个 字符 。 

一 个 通用 的 预先 读 取 输 入 的 方法 是 使 用 输入 缓冲 区 。 词 法 分 析 器 可 以 从 缓冲 区 中 读 取 一 个 
字符 , 也 可 以 把 字符 放 回 缓冲 区 。 即 使 仅 从 效率 的 角度 看 , 使 用 缓冲 区 也 是 有 意义 的 ,因为 -一 次 
读 取 一 块 字符 要 比 每 次 读 取 单 个 字符 更 加 高 效 。 我 们 可 以 用 一 个 指针 来 跟踪 已 被 分 析 的 输入 部 
分 , 向 缓冲 区 放 回 一 个 字符 可 以 通过 回 移 指针 来 实现 。 输 入 缓冲 技术 将 在 3. 2 节 中 讨论 。 

因为 通常 只 需 预 读 一 个 字符 , 所 以 一 种 简单 的 解决 方法 是 使 用 一 个 变量 ， 比 如 peek, 来 保存 下 
一 个 输入 字符 。 在 读 人 一 个 数字 的 数位 或 一 个 标识 符 的 字符 时 , 本 节 的 词法 分 析 器 会 预 读 一 个 字 
符 。 例 如 , 它 在 1 后 面 预 读 一 个 字符 来 区 分 1 和 10, E t 后 预 读 一 个 字符 来 区 分 和 true, 


2-28 ”翻译 得 到 后 织 表 示 方 式 的 语义 动作 











for ( ; ; peek = next input character ) { 

if ( peek is a blank or a tab ) do nothing: 
else if ( peek is a newline ) line = line+1; 
else break; 
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F, peck 的 值 被 设置 为 空白 符 。 词 法 分 析 器 在 寻找 下 一 个 词法 单元 时 会 跳 过 这 个 空白 符 。 本 节 中 
的 词法 分 析 器 的 不 变 式 断言 如 下 : 当 词 法 分 析 器 返回 -- 个 词法 单元 时 , 变量 pee 要 么 保存 了 当前 


词法 单元 的 词素 后 的 那个 字符 ,要么 保存 空白 符 。 
2.6.3 常量 


在 一 个 表达 式 的 文法 中 , 任何 允许 出 现 数位 的 地 方 都 应 该 允许 出 现任 意 的 整 型 常量 。 要 使 
得 表达 式 中 可 以 出 现 整数 常量 , 我 们 可 以 创建 一 个 代表 获 型 常量 的 终结 符号 ,比如 nom, 也 可 以 
将 整数 常量 的 语法 加 入 到 文法 中 。 将 字符 组 成 整数 并 计算 它 的 数值 的 工作 通常 是 由 词法 分 析 咒 
完成 的 , 因此 在 语法 分 析 和 翻译 过 程 中 可 以 将 数字 当 作 一 个 单元 进行 处 理 。 

当 在 输入 流 中 出 现 一 个 数位 序列 时 , 词法 分 析 器 将 向 语法 分 析 器 传送 一 个 词法 单元 。 该 词 
法 单元 包含 终结 符号 num 及 根据 这 些 数 位 计算 








if ( peek holds a digit ) { 


得 到 的 整 型 属性 值 。 如 果 我 们 把 词法 单元 写成 用 S: 
《) 括 起 来 的 元 组 , 那么 输入 31 +28 +59 就 被 转 dort 本 
A u = v» 10+ integer value of digit peek; 
换 成 序列 peck = next input character: 
(num, 31)( +) (num, 28)( +) (num, 59) } while { peek holds a digit );. 


在 这 里 ,终结 符号 + 没有 属性 , 所 以 它 的 元 组 ) Oe Cem o: 
就 是 (+)。 图 2-30 中 的 伪 代 码 读 取 一 个 整数 中 的 
数位 , 并 用 变量 v 累计 得 到 这 个 整数 的 值 。 图 2-30 将 数位 组 成 整数 
2.6.4 识别 关键 字 和 标识 符 
大 多 数 程序 设计 语言 使 用 for、do、if 这 样 的 固定 字符 串 作 为 标点 符号 , 或 者 用 于 标识 菜 
种 构造 。 这 些 字 符 串 称 为 关键 字 (keyword ) o 
字符 串 还 可 以 作为 标识 符 , 来 为 变量 、 数 组 、 函 数 等 命名 。 为 了 简化 语法 分 析 器 , 语言 的 文 
法 通常 把 标识 符 当 作 终 结 符号 进行 处 理 。 当 某 个 标识 符 出 现在 输入 中 时 , 语法 分 析 器 都 会 得 到 
相同 的 终结 符号 , Sid, Hlin, 在 处 理 如 下 输入 时 
count = count + increment; (2.6) 
语法 分 析 器 处 理 的 是 终结 符号 序列 id = id + id。 词 法 单元 id 有 一 个 属性 保存 它 的 词素 。 
将 词法 单元 写作 元 组 形式 , 我 们 看 到 输入 流 (2. 6) 的 元 组 序列 是 
(id, "count") (=) (id, "count") (+) (id, "increment") (;) 
关键 字 通 常 也 满足 标识 符 的 组 成 规则 , 因此 我 们 需要 某 种 机 制 来 确定 一 个 词素 什么 时 候 组 
成 一 个 关键 字 , 什么 时 候 组 成 一 个 标识 符 。 如 果 将 关键 字 作 为 保留 字 , 也 就 是 说 , 如 果 它 们 不 能 
被 用 作 标识 符 ,， 这 个 问题 相对 容易 解决 。 此 时 , 只 有 当 一 个 字符 串 不 是 关键 字 时 它 才能 组 成 一 个 
标识 符 。 
本 节 中 的 词法 分 析 器 使 用 一 个 表 来 保存 字符 串 ， 从 而 解决 了 如 下 两 个 问题 : 
e 单一 表示 。 一 个 字符 串 表 可 以 将 编译 器 的 其 余部 分 和 表 中 字符 串 的 具体 表示 隔离 开 , A 
为 编译 器 后 面 的 步骤 可 以 只 使 用 指向 表 中 字符 串 的 指针 或 引用 。 操 作 引 用 要 比 操作 字符 
味 本 身 更 加 高 效 。 
e 保留 字 。 要 实现 保留 字 , 可 以 在 初始 化 时 在 字符 串 表 中 加 入 保留 的 字符 串 以 及 它们 对 应 
的 词法 单元 。 当 词法 分 析 器 读 到 一 个 可 以 组 成 标识 符 的 字符 串 或 词素 时 , 它 首先 检查 这 
个 字符 串 表 中 是 否 有 这 个 词素 。 如 是 , 它 就 返回 表 中 的 词法 单元 , 否则 返回 带 有 终结 符 
号 id 的 词法 单元 。 








i) 
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在 Java 中 , 使 用 类 Hashtable 可 以 将 一 个 字符 串 表 实现 为 一 张 散 列表 。 下 面 的 声明 
Hashtable words = new Hashtable() ; 
将 words 初始 化 为 一 个 将 键 喘 射 到 值 的 默认 散 列 表 。 我 们 将 使 用 它 来 实现 从 词素 到 词法 单元 的 映 
射 。 图 2-31 中 的 伪 代 码 使 用 get 操作 来 查找 保留 字 。 


这 个 伪 代 码 从 输入 中 读 取 -一 个 以 字母 开头 、 由 字母 if ( peek 存放 了 一 个 字母 ) { 
这 个 伪 代 码 从 输入 中 读 取 一 个 以 字母 开头 、 由 字母 ee pe TE 











和 数位 组 成 的 字符 串 s。 我 们 假定 读 取 的 s 尽 可 能 s 二 4 中 的 字符 形成 的 字符 囊 ; 

地 长 , 即 只 要 词法 分 析 器 遇 到 字母 或 数位 , 它 就 不 te 

断 从 输入 中 读 取 字符 。 当 它 遇 到 的 不 是 字母 或 数 else { 

位 ,比如 它 遇 到 了 空白 符 , 已 读 取 的 词素 就 被 复制 oe 
到 缓冲 区 5 中 。 如 果 字 符 串 表 中 已 经 有 一 个 s 的 条 ) 

目 , 它 就 返回 由 words. get 得 到 的 词法 单元 。 这 里 。 |! 

可 能 是 一 个 关键 字 ,在 表 words 初始 化 的 时 候 这 个 $ 2031 RAER AIA 





就 已 经 在 表 中 了 ; 它 也 可 能 是 一 个 之 前 被 加 入 到 表 : 
中 的 标识 符 。 如 果 不 存 在 s 对 应 的 条 目 , 那么 由 id 和 属性 值 * 组 成 的 词法 单元 将 被 加 入 到 字符 串 
表 中 , 并 被 返回 。 
2.6.5 词法 分 析 器 
将 本 节 到 目前 为 止 给 出 的 伪 代 码 片段 组 合 起 来 , 就 可 以 得 到 一 个 返回 词法 单元 对 象 的 函数 
scan。 如 下 所 示 : l 
Token scan( ) | 

跳 过 空白 符 ， 见 2. 6. 1 节 ; 

处 理 数 字 , 见 2. 6. 3 节 ; 

处 理 保 留 宇 和 标识 符 , 见 2. 6.4 节 ; 

/* 如 果 我 们 运行 到 这 里 , 就 将 预 读 字符 peek 作为 一 个 词法 单元 */ 

Token t= new Token( peek) ; 

pek = 2 ARE / * IRR 2 6.2 讨论 的 方法 初始 化 * /; 


return t; 





] 
本 节 的 其 余部 分 将 函数 scan 实现 为 一 个 用 于 词法 分 析 的 Java 程序 包 的 一 部 分 。 这 个 叫做 


lexer 的 包 中 包含 对 应 于 各 种 词法 单元 的 类 和 一 a Token 
个 包含 函数 scan 的 类 Lexer, . int tag 

图 2-32 中 显示 了 对 应 于 各 个 词法 单元 的 类 we X Word 
及 它们 的 字段 , 但 图 中 没有 给 出 它们 的 方法 。 类 [int value | [string iezeme _| 


Token 有 一 个 tag FR, 它 用 于 做 出 语法 分 析 232 类 Token 以 及 子 类 Num 和 Work 
决定 。 子 类 Num 增加 了 一 个 用 于 存放 整数 值 的 
FE value; 子 类 Word 增加 了 一 个 字段 Lexeme, 用 于 保存 关键 字 和 标识 符 的 词素 。 

每 个 类 都 在 以 它 的 名 字 命 名 的 文件 中 。Token 类 的 文件 内 容 如 下 : 


1) package lexer; // 文件 Token.java 
) public class Token { 

) public final int tag; 

) public Token(int t) { tag = t; } 


第 一 行 指明 了 lerer 包 。 第 3 行 声明 了 字段 tag 为 final 的 , 即 它 一 旦 被 赋值 就 不 能 再 修改 。 第 
447 ERRE PR Token 用 于 创建 词法 单元 对 象 ， 比 如 
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new Token('+') 
创建 了 Token 类 的 一 个 新 对 象 , 并 且 把 它 的 tag 字段 初始 化 为 " + "的 整数 表示 。( 为 简洁 起 见 ， 
我 们 省 略 了 常用 的 方法 rostring。 该 方法 将 返回 一 个 适 于 打印 的 字符 串 。) 

在 伪 代 码 中 使 用 诸如 num, id 这 样 的 终结 符号 的 地 方 ,Java 代码 中 使 用 整 型 常量 表示 。 类 


1) package lexer; // 文件 Tag. java 

2) public class Tag { 

3 public final static int 

4) NUM = 256, ID = 257, TRUE = 258, FALSE = 259; 
5) } 


除了 值 为 整数 的 字段 NUM 和 ID 外, 这 个 类 还 定义 了 两 个 字段 TRUE 和 FALSE 以 备 后 用 , € 
们 将 用 于 演示 如 何 处 理 保留 的 关键 字 。9 

Tag 类 中 的 字段 是 public 的 , 因此 它们 可 以 在 包 的 外 面 使 用 。 它 们 同时 也 是 static W, 
因此 这 些 字 段 只 能 有 一 个 实例 , 或 者 说 拷贝 。 这 些 字段 是 final 的 , 因此 它们 只 能 被 赋值 一 次 。 
事实 上 , 这 些 常量 就 代表 常量 。 在 C 语言 中 , 可 以 使 用 aefine 语句 来 获得 类 似 的 效果 。 这 些 
define 语 句 使 得 NUM 这 样 的 名 字 可 以 被 当 作 符 号 常量 使 用 , 例如 : 

#define NUM 256 

在 伪 代 码 引 用 终结 符号 num 和 id 的 地 方 , Java 代码 引用 的 是 Tag. NUM 和 Tag. ID。 唯 一 的 
要 求 是 Tag. NUM 和 Tag. ID 必须 被 
初始 化 为 互 不 相同 的 值 ， 且 这 些 初始 
化 值 还 必须 不 同 于 那些 代表 单字 符 词 
法 单元 (比如 “ + "或 “*”) 的 常量 。 














package lexer; /1 文件 Num.java 
‘public class Num extends Token { 

public final int value; 

public Num(int v) { super(Tag.NUM); value = v; } 


) 3 
类 Num 利 Word 显示 在 图 2-33 package lexer; // 文件 Word.java 


) public class Word extends Token { 

public final String lexeme; 

public Word(int t, String s) { 
super(t); lexeme = new String(s); 


中 。 类 Num 通过 在 第 3 行 声明 一 个 整 
数字 段 value 而 扩展 了 Token。 第 4 
行 的 构造 函数 Num 调用 了 super 
(Tag. NUM), 该 函数 把 其 父 类 Token 
的 tag 字段 设 定 为 Tag.NUM。 

类 Word 既 本 用 于 保留 字 ， 也 可 
用 于 标识 符 , 因此 第 4 行 上 的 构造 函数 Word 需要 两 个 参数 : 一 个 词素 和 一 个 与 tag 对 应 的 整数 
值 。 一 个 用 于 保留 字 true 的 对 象 可 以 通过 以 下 语句 创建 : 

new Word(Tag.TRUE, "true") 
这 个 语句 创建 了 一 个 新 对 象 , 该 对 象 的 tag 字段 被 设 为 Tag. TRUE, lexeme 字段 被 设 为 字符 串 
“true”. 

用 于 词法 分 析 的 类 Lexer 显示 在 图 2-34 和 图 2-35 中 。 第 4 行 上 的 整 型 变量 line 用 于 对 输 
人 行 计数 , 第 5 行 上 的 字符 变量 peek 用 于 存放 下 一 个 输入 字符 。 

保留 字 在 第 6 行 到 第 11 行 处 理 。 第 6 行 声明 了 表 words。 第 7 行 上 的 辅助 函数 reserve 
将 一 个 字符 串 - 字 对 放 人 这 个 表 中 。 构 造 函数 Lexer 中 的 第 9 行 和 第 10 行 初 始 化 这 个 表 。 它 们 
使 用 构造 函数 Word 来 创建 字 对 象 , 这 些 对 象 被 传递 到 辅助 函数 reserve。 因 此 , 在 第 一 次 调用 
scan 之 前 , 这 个 表 被 初始 化 , 并 且 预 先 加 入 了 保留 字 “true” 和 “false” 。 


we 
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图 2-33 Token 的 子 类 Num 和 Word 





© ASCIIE 字 符 通 常 被 转化 为 0 ~255 之 间 的 整数 。 因 此 我 们 用 大 于 255 的 整数 来 表示 终 绪 符 号 。 








package lexer; // 文件 Lexer java 
import java.io.+*; import java.util.*; 

) public class Lexer { 

public int line = 1; 

private char peek =’ ?; 

private Hashtable words = new Hashtable(); 

void reserve(Word t) { words.put(t.lexeme, t); } 
8) public Lexer() { 


~ O 0 &§ wn re 
waa 





9 reserve( new Word(Tag.TRUE, "“true") ); 

10) ` reserve( new Word(Tag.FALSE, "false") ); 

11) } 

12 public Token scan() throws IOException { 

13 for( ; ; peek = (char)System.in.read() ) { 

l4 ‘if( peek == ? ? || peek == ’\t’ ) continue; 
15 else if( peek == ’\n’ ) line = line + 1; 
16) else break; 

I7 } 


j £35 GLEE] 2-35*/ 











图 2-34 词法 分 析 器 的 代码 (第 工 部 分 ) 











18 if( Character.isDigit(peek) ) { 

19 int v = 0; 

20) do { 

21 v = 10*v + Character.digit (peek, 10); 
22 peek = (char)System.in.read(); 

23 } while( Character.isDigit(peek) ); 
24) return new Num(v); 

25 } 

26 if( Character.isLetter(peek) ) { 

27 StringBuffer b = new StringBuffer() ; 
28) do { 

29) b. append (peek) ; 

30 peek = (char)System.in.read() ; 

31 } while( Character.isLetterOrDigit (peek) ); 
32 String s = b.toString(); 

33) Word w = (Word)words.get(s) ; 

34) if( w != null ) return w; 

35) w = new Word(Tag.ID, s); 

36) words.put(s, w); 

37) return w; 

38) } 

39) Token t = new Token (peek); 

40) peek = ?; 

41) return t; 

42) J 

43) } 





图 2-35 词法 分 析 器 的 代码 (第 2 部分) 

在 图 2-34 和 图 2-35 中 ， scan 的 代码 实现 了 本 节 中 的 各 个 伪 代 码 片段 。 从 第 13 行 到 第 17 行 
的 for 语句 跳 过 了 空格 、 制 表 符 和 换行 符 。 当 peek 的 值 不 是 空白 符 时 , 控制 流离 开 for 循环 。 

第 18 行 到 第 25 行 的 代码 读 取 一 个 数位 序列 。 函 数 isDigit AF Java 的 内 置 类 Charac- 
tere CEH 18 行 上 用 于 检查 peek 是 否 为 一 个 数位 。 如 是 , 第 19 行 到 第 24 行 的 代码 就 会 累积 
计算 输入 中 的 数位 序列 对 应 的 整数 值 , 然后 返回 一 个 新 的 Num 对 象 。 

第 26 行 到 第 38 行 分 析 了 保留 字 和 标识 符 。 关 键 字 true 和 false 已 经 在 第 9 行 和 第 10 行 被 保 
留 了 。 因 此 ,如 果 字 符 串 s 不 是 保留 字 , 则 程序 就 会 执行 第 35 行 , 此 时 s 一 定 是 某 个 标识 符 的 
词素 。 因 此 第 35 行 返回 一 个 新 的 word WHR, 该 对 象 的 lexeme FRIA s, tag 字段 被 设 为 
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Tag.ID。 最 后 , 第 39 行 到 第 41 行将 当前 字符 作为 一 个 词法 单元 返回 ,并 把 peek 设 为 一 个 空 
格 。 当 下 一 次 调用 scan 时 , 这 个 空格 会 被 删除 。 
2.6.6 2.6 节 的 练习 

练习 2. 6.1: 扩展 2.6.5 节 中 的 词法 分 析 器 以 消除 注释 。 注 释 的 定义 如 下 1: 

1) 以 ZV 开 始 的 注释 , 包括 从 它 开 始 到 这 一 行 的 结尾 的 所 有 字符 。 

2) 以 /* 开始 的 注释 , 包括 从 它 到 后 面 第 一 次 出 现 的 字符 序列 * /之 间 的 所 有 字符 。 

练习 2.6.2: 扩展 2.6.5 节 中 的 词法 分 析 器 , 使 它 能 够 识别 关系 运算 符 <、<=、==、! =, 


>=, >o 
练习 2.6.3: 扩展 2.6.5 节 中 的 词法 分 析 器 , 使 它 能 够 识别 浮 点 数 , 比如 2，、3.14 和 .5 等 。 
2.7 符号 表 


符号 表 ( symbol table) 是 一 种 供 编 译 器 用 于 保存 有 关 源 程序 构造 的 各 种 信息 的 数据 结构 。 这 
些 信 息 在 编译 器 的 分 析 阶 段 被 逐步 收集 并 放 人 符号 表 , 它们 在 综合 阶段 用 于 生成 目标 代码 。 符 
号 表 的 每 个 条 目 中 包含 与 一 个 标识 符 相关 的 信息 ,比如 它 的 字符 串 ( 或 者 词素 )、 它 的 类 型 、 它 的 
存储 位 置 和 其 他 相关 信息 。 符 号 表 通 常 需要 支持 同一 标识 符 在 一 个 程序 中 的 多 重 声明 。 

从 1.6.1 节 介绍 的 内 容 可 知 , 一 个 声明 的 作用 域 是 指 该 声明 起 作用 的 那 一 部 分 程序 。 我 们 将 
为 每 个 作用 域 建立 一 个 单独 的 符号 表 来 实现 作用 域 。 每 个 带 有 声明 的 程序 块 全 都 会 有 自己 的 符 
号 表 , 这 个 块 中 的 每 个 声明 都 在 此 符号 表 中 有 一 个 对 应 的 条 目 。 这 种 方法 对 其 他 能 够 设立 作用 
域 的 程序 设计 语言 构造 同样 有 效 。 例 如 , 每 个 类 也 可 以 拥有 自己 的 符号 表 , 它 的 每 个 域 和 方法 都 
在 此 表 中 有 一 个 对 应 的 条 目 。 

本 节 包 括 一 个 符号 表 模块 , 它 可 以 和 本 章 中 的 Java 翻译 器 代码 片段 一 起 使 用 。 当 我 们 在 附 
录 A 中 将 这 个 翻译 器 集成 到 一 起 时 可 以 直接 使 用 这 个 模块 。 同 时 , 为 了 简化 问题 , 本 节 的 主要 例 
子 是 一 个 被 简化 了 的 语言 , 它 只 包含 与 符号 表 相 关 的 关键 构造 ， 比 如 块 、 声 明 、 因 子 等 。 所 有 其 
他 的 语句 和 表达 式 构造 都 被 忽略 了， 这 使 得 我 们 可 以 重点 关注 符号 表 的 操作 。 一 个 程序 由 多 个 
块 组 成 , 每 个 块 包含 可 选 的 声明 和 由 单个 标识 符 组 成 的 语句 。 每 个 这 样 的 语句 都 表示 对 相应 标 
识 符 的 一 次 使 用 。 下 面 是 这 个 语言 的 一 个 例子 程序 : 

{ int x; char y; { bool y; x; y; } x; y; } (2.7) 

1.6.3 节 中 块 结构 的 例子 处 理 了 名 字 的 定义 和 使 用 。 输 入 (2.7) 仅仅 由 名 字 的 定义 和 使 用 组 成 。 

我 们 将 要 完成 的 任务 是 打印 出 一 个 修改 过 的 程序 , 程序 中 的 声明 部 分 已 经 被 删除 ， 而 每 个 
“语句 ”中 的 标识 符 之 后 都 跟着 一 个 冒号 和 该 标识 符 的 类 型 。 








谁 来 创建 符号 表 条 目 ? 

符号 表 条 目 是 在 分 析 阶 段 由 词法 分 析 器 、 语 法 分 析 器 和 语义 分 析 器 创建 并 使 用 的 。 在 本 章 中 ， 
我 们 让 语法 分 析 器 来 创建 这 些 条 目 。 因 为 语法 分 析 器 知道 一 个 程序 的 语法 结构 ,因此 相对 于 词法 
分 析 器 而 言 ， 语 法 分 析 器 通常 更 适合 创建 条 目 。 它 可 以 更 好 地 区 分 一 个 标识 符 的 不 同 声明 。 

在 有 些 情况 下 ,词法 分 析 器 可 以 在 它 碰 到 组 成 一 个 词素 的 字符 串 时 立刻 建立 一 个 符号 表 
条 目 。 但 是 在 更 多 的 情况 下 ,词法 分 析 器 只 能 向 语法 分 析 器 返回 一 个 词法 单元 ,比如 id, 以 
及 指向 这 个 词素 的 指针 。 只 有 语法 分 析 器 才能 够 决定 是 使 用 之 前 已 创建 的 符号 表 条 目 , 还 是 
为 这 个 标识 符 创建 一 个 新 条 目 。 

















© thal, 在 C 语言 中 , 程序 块 要 么 是 一 个 函数 , 要 么 是 函数 中 由 花 括 号 分 隔 的 一 个 部 分 , 这 个 部 分 中 有 一 个 或 多 个 声明 。 
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DA 在 处 理 上 面 的 输入 (2.7) 时 ,目标 是 生成 

{ { x:int; y:bool; } x:int; y:char; } 
第 一 个 x 和 和 yy 来 自 输入 (2.7) 的 内 层 块 。 由 于 x 的 使 用 指向 外 层 块 中 x 的 声明 , 因此 第 一 个 x 后 
面 跟 的 是 int， 即 该 声明 中 的 类 型 。 内 层 块 中 对 Y 的 使 用 指向 同一 个 块 中 的 声明 , 因此 具有 布尔 
类 型 。 我 们 同时 看 到 , 外 层 块 中 x My 的 使 用 的 类 型 分 别 为 整 型 和 字符 型 , 也 就 是 外 层 块 中 声明 
所 指定 的 类 型 。 D 
2.7.1 为 每 个 作用 域 设置 一 个 符号 表 

术语 “标识 符 x 的 作用 域 ”实际 上 指 的 是 x 的 某 个 声明 的 作用 域 。 术 语 作 用 域 (scope) 本 身 是 
指 一 个 或 多 个 声明 起 作用 的 程序 部 分 。 . 

作用 域 是 非常 重要 的 ， 因 为 在 程序 的 不 同 部 分 , 可 能 会 出 于 不 同 的 目的 而 多 次 声明 相同 的 标 
识 符 。 像 x 和 i 这 样 常见 的 名 字 会 被 重复 使 用 。 再 例如 , 子 类 可 以 重新 声明 一 个 方法 名 字 以 履 
mA PAA TIE. 

WRAL URE, 那么 同一 个 标识 符 的 多 次 声明 就 可 能 出 现在 同一 个 块 中 。 当 simis 能 
生成 一 个 程序 块 时 ， 下 面 的 语法 规则 会 产生 嵌 套 的 抉 ; 

block — '|' decls stmts '|' 

(我 们 对 这 个 语法 中 的 花 括号 使 用 了 引号 , 这 么 做 的 目的 是 将 它们 和 用 于 语义 动作 的 花 括 号 区 分 
开 来 。) 在 图 2-38 给 出 的 文法 中 ,decls 生成 一 个 可 选 的 声明 序列 stmis 生成 一 个 可 选 的 语句 序列 。 
更 进一步 ， 一 条 语句 可 以 是 一 个 程序 块 , 所 以 我 们 的 语言 支持 舱 套 的 语句 块 。 而 标识 符 可 以 在 这 
些 块 中 重新 声明 。 











块 的 符号 表 的 优化 

块 的 符号 表 的 实现 可 以 利用 作用 域 的 最 近 菩 套 规则 。 基 套 的 结构 确保 可 应 用 的 符号 表 形 

成 一 个 栈 。 在 栈 的 顶部 是 当前 块 的 符号 表 。 栈 中 这 个 表 的 下 方 是 包含 这 个 块 的 各 个 块 的 符号 
| Ro AIE, 符号 表 可 以 按照 类 似 于 栈 的 方式 来 分 配 和 释放 。 

有 些 编译 器 维护 了 一 个 散 列 表 来 存放 可 访问 的 符号 表 条 目 。 也 就 是 说 , 存放 那些 没有 被 
内 艇 块 中 的 某 个 声明 掩盖 起 来 的 条 目 。 这 样 的 散 列 表 实 际 上 支持 常量 时 间 的 查询 , 但 是 在 进 
人 和 离开 块 时 需要 插入 和 删除 相应 的 条 目 。 在 从 一 个 块 8 离开 时 , 编译 器 必须 撤销 所 有 因为 
B 中 的 声明 而 对 此 散 列表 作出 的 修改 。 它 可 以 在 处 理 B 的 时 候 维护 一 个 辅助 的 栈 来 跟踪 对 这 
个 散 列 表 的 所 做 的 修改 。 








语句 块 的 最 近 谱 套 ( mostrelosely ) 规则 是 说 ， 一 个 标识 符 * 在 最 近 的 < 声明 的 作用 域 中 。 也 就 
是 说 , 从 * 出 现 的 块 开 始 , 从 内 向 外 检查 各 个 块 时 找到 的 第 一 个 对 x 的 声明 。 
DAE 下 列 仿 代码 用 下 标 来 区 分 对 同一 标识 符 的 不 同 声明 : 


1) | intz; int y,; 


2) | int w,; bool y,; intz; 

3) wyg eag oy ea 
4) | 

5) wpe peg eyes 

6) | 


下 标 并 不 是 标识 符 的 一 部 分 , 它 实际 上 是 该 标识 符 对 应 的 声明 的 行 号 。 因 此 , x 的 所 有 出 现 都 位 
于 第 工行 上 声明 的 作用 域 中 。 第 3 行 上 出 现 的 y 位 于 第 2 行 上 y 的 声明 的 作用 域 中 , 因为 y 在 内 
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层 块 中 被 再 次 声明 了 。 然 而 , 第 5 行 上 出 现 的 y 位 于 第 1 行 上 y 的 声明 的 作用 域 中 。 

假设 第 5 行 上 w 的 出 现 位 于 这 个 程序 片段 之 外 某 个 w 的 声明 的 作用 域 中 , 它 的 下 标 表示 一 
个 全 局 的 或 者 位 于 这 个 块 之 外 的 声明 。 

最 后 , z 在 最 内 层 的 块 中 声明 并 使 用 。 它 不 能 在 第 5 行 上 使 用 , 因为 这 个 内 暴 的 声明 只 能 作 
用 于 最 内 层 的 块 。 

实现 语句 块 的 最 近 髓 套 规则 时 , 我 们 可 以 将 符号 表 链 接 起 来 , 也 就 是 使 得 内 谤 语句 抉 的 符号 
表 指 向 外 围 语句 块 的 符号 表 。 


OF 



































Bo: w| 
图 236 显示 了 对 应 于 例 2.15 中 伪 代 码 的 符号 P 
Xo B, 对 应 于 从 第 1 行 开始 的 语句 块 ; B 对 应 着 从 第 2 B: [Tiat[ C 
行 开始 的 语句 块 。 图 的 顶端 是 符号 表 B, 它 记 录 了 全 局 y jint 














的 或 由 语言 提供 的 默认 声明 。 在 我 们 分 析 第 2 行 至 第 4 行 B: [foje] | 

时 ,环境 是 由 一 个 指向 最 下 层 的 符号 表 ( 即 By 的 符号 表 ) E bool 

的 指针 表示 的 。 当 我 们 分 析 第 5 行 时 ，B2 的 符号 表 变 得 

不 可 访问 , 环境 指针 转 而 指向 Bi 的 符号 表 , 此 时 我 们 可 图 2-36 ”对 应 于 例 2. 15 的 符号 表 链 

以 访问 上 一 层 的 全 局 符号 表 B, 但 不 能 访问 B, 的 符号 表 。 a 
图 2-37 中 是 链接 符号 表 的 Java 实现 。 它 定义 了 一 个 类 Env ( MEE“ environment” 的 缩写 )@ 








z {int 











o 创建 一 个 新 符号 表 。 图 2-37 中 第 6 行 至 第 8 TMM BW Env(p) 创建 一 个 Env 对 
象 , 该 对 象 包含 一 个 名 为 able 的 散 列表 。 这 个 对 象 的 字段 prev 被 设置 为 参数 p, 而 
这 个 参数 的 值 是 一 个 环境 , 因此 这 个 对 象 被 链接 到 环境 。 虽 然 形成 链表 的 是 Env 对 象 ， 
但 是 将 它们 说 成 是 链接 的 符号 表 比 较 方 便 。 





1) package symbols; // 文件 Envjava 

2) import java.util.*; 

3) public class Env { 

4 private Hashtable table; 

5 protected Env prev; 

6) public Env(Env p) { 

7 table = new Hashtable(); prev = p; 

} 

9) public void put(String s, Symbol sym) { 

10 table.put(s, sym); 

11 ee 

12 public Symbol get (String s) { 

13) for( Env e = this; e != null; e = e.prev ) { 
14) Symbol found = (Symbol) (e.table.get(s)); 
15) if( found != null ) return found; 

16 } 

17) return null; 
-18 } 

19) } 














图 2-37 类 Env 实现 了 链接 符号 表 
© 在 当前 表 中 加 入 一 个 新 的 条 目 。 散 列表 保存 了 键 - 值 对 ,其 中 
B 键 (key ) 是 一 个 字符 串 , 也 可 以 说 是 一 个 指向 字符 串 的 引用 。 我 们 也 可 以 使 用 指向 对 应 





O “环境 "是 另 一 个 用 于 表示 与 程序 中 某 个 点 相关 的 符号 表 集 合 的 术语 。 
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于 标识 符 的 词法 单元 对 象 的 引用 作为 键 。 
m 值 (value) 是 一 个 Symbol 类 的 条 目 。 第 9 行 到 第 11 行 的 代码 不 需要 知道 一 个 条 目的 
内 部 结构 。 也 就 是 说 , 这 个 代码 是 独立 于 Symbol 类 的 字段 和 方法 的 。 
© 得 到 一 个 标识 符 的 条 目 。 它 从 当前 块 的 符号 表 开 始 搜 索 链 接 符号 表 。 第 12 行 至 第 18 行 
中 这 个 操作 的 代码 返回 一 个 符号 表 条 目 或 nul1。 
因为 会 有 多 个 语句 块 嵌 套 在 同一 外 围 语句 块 中 , 所 以 将 这 些 符 号 表 链 接 起 来 就 可 以 形成 一 
个 树 形 结构 。 图 2-36 中 的 虚线 提醒 我 们 链接 的 符号 表 可 以 形成 一 棵 树 。 
2. 7.2 符号 表 的 使 用 
从 效果 看 , 一 个 符号 表 的 作用 是 将 信息 从 声明 的 地 方 传递 到 实际 使 用 的 地 方 。 当 分 析 标 识 
符 x 的 声明 时 , 一 个 语义 动作 将 有 关 x 的 信息 “ 放 和 人 "符号 表 中 。 然 后 , 一 个 像 factor sid 这 样 的 
产生 式 的 相关 语义 动作 从 符号 表 中 “取出 "这 个 标识 符 的 信息 。 因 为 对 一 个 表达 式 E op E1( 其 中 
op 代表 一 般 的 运算 符 ) 的 翻译 只 依赖 于 对 Ei 和 Es 的 翻译 , 不 直接 依赖 于 符号 表 ， 所 以 我 们 可 以 
加 入 任意 数量 的 运算 符 , 而 不 会 影响 从 声明 通过 符号 表 到 达 使 用 地 点 的 基本 信息 流 。 
JA 图 2-38 中 的 翻译 方案 说 明了 如 何 使 用 类 En, XS ET RERA EEA, 声明 利 
使 用 。 它 实现 了 例 2. 14 中 描述 的 翻译 。 如 前 面 描述 的 ， 在 处 理 输入 
{ int x; char y; { bool y; x; y; } x; y; } 
时 ,这 个 翻译 方案 过 滤 掉 了 各 个 声明 , 并 生成 
{ { x:int; y:bool; } x:int; y:char; } $ ; 
请 注意 图 238 中 各 个 产生 式 的 体 都 已 经 对 齐 ,， 因此 所 有 的 文法 符号 出 现在 同一 列 上 , 并 且 
所 有 的 语义 动作 都 出 现在 第 二 列 上 。 结 果 , 一 个 产生 式 体 的 各 个 组 成 部 分 常常 分 开 出 现在 多 
行 上 。 











program = { top = null; } 
block 


block -= t { saved = top; 
top = new Env(top); 
print("{ "); } 
decls stmts'} { top = saved; 
print("} "); } 


decls —> decls decl 
| € 
del ~ typeid,; { s = new Symbol; 
s.type = type.lexeme; 
top.put(id.lereme, s); } 


stmts -> = stmts stmt 
| < 


stmt — block 


| factor ; { print("; "); } 
factor > id { s = top-.get(id.lezeme); 
print(id leceme); 
print("':"); 


print(s.type);} 








图 2-38 使 用 符号 表 翻 译 带 有 语句 块 的 语言 
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现在 考虑 请 义 动作 。 这 个 翻译 方案 在 进入 和 离开 块 的 时 候 将 分 别 创建 和 释放 符号 表 。 变 基 
top 表示 一 个 符号 表 链 的 顶部 的 顶层 符号 表 。 这 个 翻译 方案 的 基础 文法 的 第 一 个 产生 式 是 Pre- 
gram—>blocko FE block 之 前 的 语义 动作 将 top 初始 化 为 null， 即 不 包含 任何 条 目 。 

第 二 个 产生 式 block+ '%'{ decls songs 小 中 包含 了 进入 和 离开 块 时 的 语义 动作 。 在 进入 块 时 ， 
在 decls 之 前 , 一 个 语义 动作 使 用 局 部 变量 saved 保存 了 对 当前 符号 表 的 引用 。 这 个 产生 式 的 每 次 
使 用 都 有 一 个 单独 的 局 部 变量 saved ,这 个 变量 和 这 个 产生 式 的 其 他 使 用 中 的 局 部 变量 都 不 同 。 
在 一 个 递归 下 降 语法 分 析 器 中 ， saved 可 以 是 block 对 应 的 过 程 的 局 部 变量 。 对 于 递归 函数 中 的 局 
部 变量 的 处 理 方法 将 在 7. 2 节 中 讨论 。 代 码 

top = new Env( top); 

将 变量 top 设置 为 刚刚 创建 的 新 符号 表 。 这 个 新 符号 表 被 链接 到 进入 这 个 块 之 前 一 刻 top 的 原 值 。 
变量 top 是 类 Env 的 一 个 对 象 , PI PBK Eno 的 代码 显示 在 图 2-37 中 。 

在 离开 块 时 ,| "之 后 的 一 个 语义 动作 将 top 的 值 恢复 为 进入 块 时 保存 起 来 的 值 。 从 实际 效果 
看 , 这 个 表 形 成 了 一 个 栈 , top 恢复 为 之 前 保存 的 值 实际 上 是 将 该 块 中 各 个 声明 的 结果 弹出 
栈 引 。 这 样 就 使 得 该 块 中 的 声明 在 块 外 不 可 见 。 

声明 decl—type id 的 结果 是 创建 一 个 对 应 于 已 声明 标识 符 的 新 条 目 。 我 们 假设 词法 单元 
type 和 id 都 有 一 个 相关 的 属性 , 分 别 是 被 声明 标识 符 的 类 型 和 词素 。 我 们 不 会 讨论 符号 对 象 s 
的 所 有 字段 , 但 是 我 们 假设 对 象 中 有 -个 字段 type 给 出 该 符号 的 类 型 。 我 们 创建 一 个 新 的 符号 
WE s, 并 通过 代码 s. type = type. lexeme 为 它 赋予 正确 的 类 型 。 整 个 条 目 使 用 iop. put (id. lexeme , s) 
加 入 到 顶层 的 符号 表 中 。 . 

PEE ch factor id 中 的 语义 动作 通过 符号 表 获 取 这 个 标识 符 的 条 目 。 操 作 get 从 top 开始 搜索 
符号 表 链 中 的 第 一 个 关于 此 标识 符 的 条 目 。 搜 索 得 到 的 条 目 包 含有 关 该 标识 符 的 所 有 信息 ， 比 
如 标识 符 的 类 型 。 口 


2.8 生成 中 间 代 码 


编译 器 的 前 端 构 造 出 源 程序 的 中 间 表 示 ,， 而 后 端 根据 这 个 中 间 表 示 生 成 目标 程序 。 在 这 一 
TE, 我 们 考虑 表达 式 和 语句 的 中 间 表 示 形 式 , 并 给 出 一 个 如 何 生成 中 间 表 示 的 指导 性 的 例子 。 
2.8.1 两 种 中 间 表 示 形 式 

正如 我 们 在 2.1 节 ( 特 别 是 在 图 2-4 中 ) 指 出 的 , 两 种 最 重要 的 中 间 表 示 形 式 是 : 

e 树 型 结构 , 包括 语法 分 析 树 和 (抽象 ) 语法 树 。 

o 线性 表示 形式 , 特别 是 “三 地 址 代码 ”。 

抽象 语法 树 (或 简称 语法 树 ) 曾 在 2. 5.1 节 中 介绍 过 。 我 们 将 在 5.3. 1 节 中 更 加 正式 地 探讨 
它 。 在 语法 分 析 过 程 中 , 将 创建 抽象 语法 树 的 结 点 来 表示 有 意义 的 程序 构造 。 随 着 分 析 的 进行 ， 
官 息 以 与 结 点 相关 的 属性 的 形式 被 添加 到 这 些 结 点 上 。 选 择 哪 些 属性 要 依据 待 完成 的 翻译 来 
决定 。 

另 一 方面 , 三 地 址 代码 是 一 个 由 基本 程序 步 又 ( 比如 将 两 个 值 的 相 加 ) 组 成 的 序列 。 和 树 形 结 
构 不 一 样 , 它 没有 层次 化 的 结构 。 正 如 我 们 将 在 第 9 章 中 看 到 的 那样 ， 如果 我 们 想 对 代码 做 出 显著 
的 优化 , 就 需要 这 种 表示 形式 。 在 那 种 情况 下 , 我 们 可 以 把 组 成 程序 的 很 长 的 三 地 址 语句 序列 分 解 











O 我 们 也 可 以 使 用 另 一 种 方法 来 处 理 , 可 以 在 类 Env 中 加 人 静态 操作 push 和 和 pop， 而 不 用 显 式 地 保存 和 恢复 符 
号 表 。 


58 BIE 





为 “基本 块 "。 所 谓 基 本 块 就 是 一 个 总 是 逐个 顺序 执行 的 语句 序列 , 执行 时 不 会 出 现 分 支 跳 转 。 
除了 创建 一 个 中 间 表 示 之 外 , 编译 器 前 端 还 会 检查 源 程 序 是 否 遵循 源 语 言 的 语法 和 语义 规 
则 。 这 种 检查 称 为 静态 检查 (static check) ,“ 蒋 态 ” 一般 是 指 “ 由 编译 器 完成 "9S。 静 态 检查 确保 
一 些 特定 类 型 的 程序 错误 , 包括 类 型 不 匹配 , 能 在 编译 过 程 中 被 检测 并 报告 。 
编译 器 可 以 在 创建 抽象 语法 树 的 同时 生成 三 地 址 代码 序列 。 然 而 , 在 通常 情况 下 , 编译 器 实 
际 上 并 不 会 创建 出 存放 了 整 棵 抽象 语法 树 的 数据 结构 , 它 仅 仅 “ 假装 "构造 了 一 棵 抽象 语法 树 ， 
同时 生成 三 地 址 代码 。 编 译 器 在 分 析 过 程 中 只 会 保存 将 用 于 语义 检查 或 其 他 目的 的 结 点 及 其 属 
性 , 同时 也 保存 了 用 于 语法 分 析 的 数据 结构 ,而 不 会 保存 整 棵 抽象 语法 树 。 经 过 这 样 的 处 理 , 构 
造 三 地 址 代码 时 要 使 用 到 的 那 部 分 语法 树 在 需要 时 都 是 可 用 的 , 一 旦 不 青 需 要 就 会 被 释放 。 我 
们 将 在 第 5 章 详细 讨论 这 个 过 程 。 l 
2.8.2 语法 树 的 构造 
我 们 将 首先 给 出 一 个 可 以 创建 抽象 语法 树 的 翻译 方案 , 然后 在 2. 8. 4 节 中 说 明 如 何 修改 这 个 
翻译 方案 , 使 得 它 可 以 在 构造 语法 树 的 同时 生成 三 地 址 代码 , 或 者 让 它 只 生成 三 地 址 代码 。 
回顾 一 下 2.5.1 节 , 下面 的 语法 树 





op 
Yo OS 
E E 
表示 将 运算 符 op 应 用 于 El ME, 所 代表 的 子 表 达 式 而 得 到 的 表达 式 。 我 们 可 以 为 任意 的 构造 创 
建 抽象 语法 树 ,而 不 仅仅 为 表达 式 创 建 语法 树 。 每 个 构造 用 一 个 结 点 表示 ， 其 子 结 点 代表 此 构造 
中 具有 语义 含义 的 组 成 部 分 。 比 如 , 在 C 语言 的 一 个 while 语句 
while ( expr ) stmt 
中 ,具有 语义 含义 的 组 成 部 分 是 表达 式 expr 和 语句 set? RRM while 语句 的 抽象 语法 树 结 点 


有 一 个 运算 符 , 我 们 称 为 while, 并 有 两 个 子 结 点 一 一 分 别 是 expr 和 stmt 的 抽象 语法 树 。 

图 2-39 中 的 翻译 方案 为 一 个 有 代表 性 但 却 很 简单 的 由 表达 式 和 语句 组 成 的 语言 构造 出 一 棵 
语法 树 。 这 个 翻译 方案 中 的 所 有 非 终结 符 都 有 一 个 属性 上， 即 语法 树 的 一 个 结 点 。 这 些 结 点 被 实 
现 为 类 Node 的 对 象 。 

类 Node 有 两 个 直接 子 类 : 一 个 是 Expr, 代表 各 种 表达 式 ; 另 一 个 是 Stm, 代表 各 种 语句 。 每 
一 种 语句 都 有 一 个 对 应 的 Simt 的 子 类 。 比 如 , 运算 符 while 对 应 于 子 类 While。 一 个 对 应 于 运算 
符 while, 子 结 点 为 x My 的 语法 树 结 点 可 以 由 如 下 伪 代 码 创建 : 

new While(x, y) 

它 通过 调用 构造 晴 数 While 创建 了 类 While 的 一 个 对 象 , 其 名 称 和 类 名 相同 。 就 和 构造 函数 
对 应 于 运算 符 一 样 ,构造 函数 的 参数 对 应 于 抽象 语法 中 的 运算 分 量 。 

当 我 们 研究 附录 A 中 的 详细 代码 时 , 我 们 就 会 发 现 各 个 方法 在 这 个 类 层次 结构 中 的 位 置 。 
在 本 节 中 , 我 们 将 简单 讨论 一 下 这 些 方法 中 的 一 小 部 分 。 

我 们 将 依次 考虑 图 2-39 中 的 每 一 条 产生 式 和 规则 。 首 先 , 我们 将 解释 定义 各 种 类 型 语句 的 
产生 式 ， 然 后 再 解释 用 于 定义 有 限 几 种 表达 式 的 产生 式 。 








O 和 它 的 对 应 "动态 " 指 的 是 “ 当 程 序 运行 时 " 。 很 多 语言 也 会 进行 某 些 动态 检查 。 比 如 , 像 Java 这 样 的 面向 对 象 语言 
有 时 必须 在 程序 执行 时 检查 类 型 ， 因 为 可 能 需要 根据 一 个 对 象 的 特定 子 类 来 决定 应 该 将 哪个 方法 应 用 于 该 对 象 。 

O 其 中 的 右 括号 的 唯一 作用 是 将 表达 式 和 语句 分 开 。 左 括号 实际 上 没有 任何 含义 , 把 它 放 在 那里 只 是 为 了 让 while 
语句 看 起 来 顺眼 一 些 , 因为 如 果 没 有 左 括号 , C 语言 中 就 会 出 现 不 匹配 的 括号 对 。 
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program — block { return block.n; } 


block = '{' stmts '}' { block.n = stmis.n; } 


Stmis => stmts, stmt { stints. = new Seq (stimts,.n, stmt); } 
| e { stmis.n = null; } 
stmt > expr ; { stmin = new Eval(expr.n); } 


| if ( expr) stmt; 

{ stmin = new If(expr.n, stmt;.n); } 
| while ( expr) stmt, a 

{ stmt.n = new While(erpr.n, stmt, .n); } 
| do stmt, while ( expr ); 

{ stmin = new Do(stmt;.n, expr.n); } 


| block { stmtn = block.n; } 
expr — rel = espr { ezprn = new Assign('="',rel.n, expr,.n); } 
| rel { expr.n = reln; } 
rel > rel; < add { reln = new Rel('<‘, rel .n, add.n); } 
| reh <= add { reln = new Rel(‘<', reh .n, add.n); } 
| add { ren = add.n; } 


add — add, + term { add.n = new Op('+', addin, term.n); } 
| term { add.n = term.n; } 


term > term, * factor { termn = new Op('*', term.n, factor.n); } 


| factor { term.n = factor.n; } 
factor => ( expr) { factor.n = expr.n; } 
| num { factor.n = new Num(num.value); } 








图 2-39 ”为 表达 式 和 语句 构造 抽象 语法 树 

语句 的 抽象 语法 树 

我 们 在 抽象 语法 中 为 每 一 种 语句 构造 定义 了 相应 的 运算 符 。 对 于 以 关键 字 开 头 的 构造 , 我 
们 将 使 用 这 个 关键 字 作 为 对 应 的 运算 符 。 因 此 , 我 们 把 while 作为 while 语句 的 运算 符 , 而 把 do 
作为 do-while 语句 的 运算 符 。 对 于 条 件 语句 , 我 们 定义 了 两 个 运算 符 ifelse 和 站, 分 别 对 应 于 带 有 
和 不 带 有 else 部 分 的 过 语 句 。 在 我 们 简单 的 示例 性 语言 中 , 我 们 没有 使 用 else, 所 以 仅 有 一 种 if 
语句 。 增 加 else 会 在 语法 分 析 过 程 中 产生 一 些 问题 。 我 们 将 在 4. 8. 2 节 中 讨论 这 些 问 题 。 

每 个 语句 运算 符 都 有 一 个 对 应 的 同名 的 类 , 但 是 类 名 的 首 字 符 要 大 写 。 比 如 ,类 MMF 
站。 此 外 ,我 们 还 定义 了 子 类 Seq, 它 表 示 一 个 语句 序列 。 这 个 子 类 对 应 于 文法 中 的 非 终结 符号 
stmts。 这 些 类 都 是 Simi FFAS, 而 Stm 又 是 Node 的 子 类 。 

图 2-39 中 的 翻译 方案 说 明了 抽象 语法 树 结 点 的 构建 方法 。 一 个 典型 的 用 于 站 语 句 的 规则 如 下 : 

stmt 一 > if(expr) stmt, | simi.n = new If(expr. n, stmt,.n); | 

站 语句 中 具有 语义 合 义 的 成 分 是 expr 和 stmt, 。 语 义 动作 将 结 点 stmt. n 定义 为 子 类 大 的 一 个 
新 对 象 。 我 们 没有 给 出 匠 的 构造 函数 的 代码 。 它 创建 一 个 标号 为 过 , 子 结 点 为 expr. n 和 stmt. n 
的 新 结 点 。 

表达 式 语句 不 以 某 个 关键 字 开 头 , 所 以 我 们 定义 了 一 个 新 运算 符 eval 及 类 Eval( 其 中 Eval 是 
Simi 的 一 个 子 类 ) 表 示 表 达 式 语句 。 相 关 的 规则 如 下 : 

stmt -> expr; | stmt.n = new Eval(expr.n); | 
在 抽象 语法 树 中 表示 语句 块 
在 图 2-39 F, 另 一 个 语句 构造 是 由 一 系列 语句 组 成 的 语句 块 。 考 虑 下 面 的 规则 : 
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stmt —> block | stmt.n = block. n; | 

block — '|' stmts'’}' | block. n = stmts. n; | 
第 一 个 规则 说 明 当 一 个 语句 是 一 个 语句 块 时 , 它 的 抽象 语法 树 和 这 个 语句 块 的 相同 ; 第 二 个 规则 
说 明 非 终结 符号 block 对 应 的 抽象 语法 树 就 是 该 块 中 的 语句 序列 对 应 的 语法 树 。 

为 简单 起 见 , 图 2-39 中 的 语言 不 包含 声明 。 昌 然 在 附录 A 中 包含 声明 , 但 我 们 将 看 到 一 个 
语句 块 的 抽象 语法 树 仍然 就 是 块 中 的 语句 序列 的 抽象 语法 树 。 因 为 声明 中 的 信息 已 经 加 入 到 符 
号 表 中 , 所 以 它们 不 需要 出 现在 抽象 语法 树 中 。 因 此 , 不 管 它 是 否 包 含 声明 , 语句 块 在 中 间 代 码 
中 看 起 来 就 是 一 个 普通 的 语句 构造 。 

一 个 语句 序列 的 表示 方法 如 下 : 用 一 个 叶子 结 点 null 表示 一 个 空 语句 序列 , 用 运算 符 seq 表 
示 一 个 语句 序列 。 规 则 如 下 : 

stmis — simis, stmt | stmis.n = new Seq(simis,.n, stmt.n); | 
在 图 2-40 中 , 我 们 可 以 看 到 表示 一 个 语句 块 或 语句 列表 的 语法 树 的 一 部 分 。 列 表 中 
有 两 个 语句 。 第 一 个 语句 是 一 个 让 语句 , 第 二 个 语句 是 while 语句 。 我 们 没有 显示 在 这 个 语句 列 
表 之 上 的 那 部 分 抽象 语法 树 , 并 且 将 各 棵 子 树 用 三 角形 表示 , 包括 这 个 语句 列表 中 对 应 于 证 语句 
和 while 语句 的 条 件 的 抽象 语法 树 , 以 及 对 应 于 这 两 个 语句 的 子 语 句 的 语法 树 。 口 

















图 2-40 ”由 一 个 这 语句 和 一 个 while 语句 组 成 的 语句 列表 的 语法 树 的 一 部 分 
表达 式 的 语法 树 
在 以 前 的 章节 中 , 我 们 用 三 个 非 终 结 符号 expr, term 和 factor 使 得 乘法 * 相对 加 法 + 具有 和 较 
高 的 优先 级 。 我 们 在 2. 2. 6 节 中 指出 , 非 终结 符号 的 数目 正好 比 表 达 式 中 优先 级 的 层 数 多 一 。 在 
图 2-39 中 , 我 们 增添 了 两 个 同 优先 级 的 比较 运算 符 < 和 <= ， 同 时 也 保留 了 + 和 * 运算 符 , 故我 
们 增加 了 一 个 新 的 非 终结 符号 addo 





抽象 语法 允许 我 们 将 “相似 的 "运算 符 分 为 一 组 ， 以 减少 | AE 
在 实现 表达 式 时 需要 处 理 的 不 同情 况 和 和 需要 设计 的 子 类 。 在 a 
本 章 中 ,“ 相 似 的 " 意 指 运算 符 的 类 型 检查 规则 和 代码 生成 规 rel 
则 相近 。 比 如 , 运算 符 + 和 * 通常 分 为 一 组 ,因为 它们 可 以 = 
用 同一 种 方式 进行 处 理 一 一 它们 对 运算 分 量 类 型 的 要 求 是 一 op 
样 的 , 且 它 们 都 会 生成 一 个 将 一 个 运算 符 应 用 到 两 个 数值 之 | ae 
上 的 三 地 址 指令 。 一 般 来 说 , 在 抽象 语法 中 对 运算 符 分 组 是 | access 





根据 编译 器 后 期 处 理 的 需要 来 决定 的 。 图 2-41 中 的 表 描述 了 


几 种 常见 Java 运算 符 的 具体 语法 和 抽象 语法 之 间 的 对 应 PA 有 种 常见 Java Se 
关系 。 的 具体 语法 和 抽象 语法 


在 具体 语法 中 , 几乎 所 有 的 运算 符 都 是 左 结合 的 ， 只 有 赋值 运算 符 = 是 右 结合 的 。 同 一 行 中 
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的 运算 符 具 有 同样 的 优先 级 , 也 就 是 说 == 和 != 具有 同样 的 优先 级 。 各 行 是 按照 优先 级 递增 的 
方式 排列 的 ,比如 == LE && 或 = 的 优先 级 更 高 。 -wory 中 的 下 标 unary 用 于 区 分 单 目 减 号 ( 比如 
-2 中 的 符号 ) 和 和 双 目 减 号 (比如 2 -a 中 的 符号 ) 。 运 算 符 [表示 数组 访问 , 例如 ali]. 

图 中 “抽象 语法 ” 列 描述 了 运算 符 的 分 组 方法 。 赋 值 运算 符 = 所 在 的 组 仅 包 含 它 自 己 。 组 
cond 包含 了 条 件 布尔 运算 符 && 和 1H。 组 rel 包含 == 和 < 所 在 行 中 的 各 个 关系 比较 运算 符 。 组 
op 包含 诸如 + 和 * 这 样 的 算术 运算 符 。 单 目 减 、 由 辑 非 和 数组 访问 运算 符 各 自 为 一 组 。 

图 2-41 中 具体 语法 和 抽象 语法 之 间 的 映射 关系 可 以 通过 编写 翻译 方案 来 实现 。 图 2-39 中 的 
非 终结 符号 expr, rel, add, term 和 factor 的 产生 式 描 述 了 一 些 运算 符 的 具体 语法 。 这 些 运 算 符 是 
图 2-41 中 的 运算 符 的 一 个 代表 性 子 集 。 这 些 产生 式 中 的 语义 动作 创建 出 相应 的 语法 树 结 点 。 比 
如 , 规则 

term — term, * factor | term.n = new Op ('*', term,.n, factor. n); | 
创建 了 类 Op 的 结 点 , 这 个 类 实现 了 图 2-41 中 被 分 在 op 组 中 的 运算 符 。 构 造 函 数 Op 的 参数 中 包 
含 了 7 一 个 '*', 它 指 明了 实际 的 运算 符 。 它 的 参数 还 包括 对 应 于 子 表 达 式 的 结 点 termj. n 和 fac- 
tor, No 
2.8.3 静态 检查 : i 

静态 检查 是 指 在 编译 过 程 中 完成 的 各 种 一 致 性 检查 。 这 些 检查 不 但 可 以 确保 一 个 程序 被 顺 
利 地 编译 ,而 且 还 能 在 程序 运行 之 前 发 现 编程 错误 。 静 态 检查 包括 : 

e 语法 检查 。 语 法 要 求 比 文法 中 的 要 求 的 更 多 。 例 如 下 面 的 这 些 约束 : 任何 作用 域内 同一 

个 标识 符 最 多 只 能 声明 一 次 , 一 个 break 语句 必须 处 于 一 个 循环 或 switch 语句 之 内 。 这 些 
约束 都 是 语法 要 求 , 但 是 它们 并 没有 包括 在 用 于 语法 分 析 的 文法 中 。 

e 类 型 检查 。 一 种 语言 的 类 型 规则 确保 一 个 运算 符 或 函数 被 应 用 到 类 型 和 数量 都 正确 的 运 

算 分 量 上 。 如 果 必 须要 进行 类 型 转换 ， 比 如 将 一 个 浮 点 数 与 一 个 整数 相 加 时 ,类 型 检查 
器 就 会 在 语法 树 中 插入 一 个 运算 符 来 表示 这 个 转换 。 下 面 我 们 将 使 用 常用 的 术语 “自动 
类 型 转换 ”来 讨论 类 型 转换 的 问题 。 

左 值 和 右 值 

现在 我 们 考虑 一 些 简单 的 静态 检查 , 它们 可 以 在 源 程 序 的 抽象 语法 树 构造 过 程 中 完成 。 一 
般 来 说 , 在 进行 复杂 的 静态 检查 时 ,首先 要 生成 源 程序 的 某 个 中 间 表 示 , 然后 再 分 析 这 个 中 间 
表示 。 

赋值 表达 式 左 部 和 右 部 的 标识 符 的 含义 是 不 一 样 的。 在 下 面 的 两 个 赋值 语句 


i = 5; 
is i+ 1; 


中 ,表达 式 的 右 部 描述 了 一 个 整数 值 , 而 左 部 描述 的 是 用 来 存放 该 值 的 存储 位 置 。 术 语 左 值 (1- 
value) 和 右 值 (r-value) 分别 表示 可 以 出 现在 赋值 表达 式 左 部 和 右 部 的 值 。 也 就 是 说 , 右 值 是 我 们 
通常 所 说 的 “ 值 ”, 而 左 值 是 存储 位 置 。 

静态 检查 要 确保 一 个 赋值 表达 式 的 左 部 表示 的 是 一 个 左 值 。 一 个 像 i 这 样 的 标识 符 是 一 个 
左 值 , 像 a[2] 这 样 的 数组 访问 也 是 左 值 , 但 2 这 样 的 常量 不 可 以 出 现在 一 个 赋值 表达 式 的 左 部 ， 
因为 它 有 一 个 右 值 , 但 不 是 左 值 。 











类 型 检查 
类 型 检查 确保 一 个 构造 的 类 型 符合 其 上 下 文 对 它 的 期 望 。 比 如 说 , fe if A : 
if( expr) stmt 


中 , 期 望 表 达 式 expr 是 boolean 型 的 。 


4S ae 
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类 型 检查 规则 按照 抽象 语法 中 运算 符 / 运 算 分 量 的 结构 进行 描述 。 假 设 运算 符 rd 表示 关系 
运算 符 , 如 <= 。 那 么 运算 符 组 rel 的 类 型 规则 是 : 它 的 两 个 运算 分 量 必须 具有 相同 的 类 型 ， 而 其 
结果 为 布尔 类 型 。 用 属性 type 来 表示 一 个 表达 式 的 类 型 , 令 卫 表示 将 rel 应 用 于 El 和 E, 的 表达 
So PA E 的 类 型 检查 可 以 在 创建 它 对 应 的 抽象 语法 树 的 结 点 时 进行 , 执行 如 下 所 示 的 代码 
BPEJ: 

if( El. type == E}. type) E. type = boolean; 

else error ; 
即使 在 下 面 的 情况 下 , M A AK Se RAER A A A DE BD RAR: 

e 自动 类 型 转换 。 当 一 个 运算 分 量 的 类 型 被 自动 转换 为 运算 符 所 期 望 的 类 型 时 ,就 发 生 了 
自动 类 型 转换 (coercion ) 。 在 一 个 像 2 * 3.14 这 样 的 表达 式 中 , 常见 的 转换 是 将 整数 2 
转换 为 一 个 等 值 的 浮 点 数 2.0, 然后 对 得 到 的 两 个 浮 点 运算 分 量 执行 相应 的 浮 点 运算 。 
程序 设计 语言 的 定义 指明 了 人 允许 的 自动 类 型 转换 方式 。 比 如 ， 上面 讨 论 的 rel 的 实际 规则 
可 能 是 这 样 的 ; Ej. type ME. type 可 以 被 转换 成 相同 的 类 型 。 如 果 是 那样 , 把 一 个 整数 和 
一 个 浮 点 数 比较 就 是 合法 的 。 

e ER, Java 中 的 运算 符 + 应 用 于 整数 运算 分 量 时 表示 相 加 ,而 应 用 于 字符 串 型 运算 分 量 
时 表示 连接 。 如 果 一 个 符号 在 不 同上 下 文中 有 不 同 的 含义 , 那么 我 们 说 这 个 符号 是 重 载 
(overloading) 的 。 因 此 , 在 Java 中 + 是 重 载 的 。 我 们 可 以 通过 已 知 的 运算 分 量 类 型 和 结 
果 类 型 来 判断 一 个 重 载 的 运算 符 的 含义 。 比 如 , 如果 我 们 知道 x、y 或 z 中 的 任意 一 个 是 
字符 串 类 型 ,那么 表达 式 z =x +y 中 的 运算 符 + 的 含义 就 是 连接 。 然 而 , 如果 我 们 还 知 
道 其 中 另 一 个 运算 分 量 是 整 型 的 , 那么 我 们 就 找到 了 一 个 类 型 错误 ，+ 的 这 次 使 用 就 没 
有 意义 。 

2.8.4 三 地 址 码 

一 旦 抽象 语法 树 构 造 完成 , 我 们 就 可 以 计算 树 中 各 结 点 的 属性 值 并 执行 各 结 点 中 的 代码 片 
E, 进行 进一步 的 分 析 和 综合 。 我 们 将 说 明 如 何 通 过 遍历 语法 树 来 生成 三 地 址 代码 。 具 体 地 说 ， 
我 们 将 显示 如 何 编写 一 个 抽象 语法 树 的 函数 , 并 且 同 时 生成 必要 的 三 地 址 代码 。 





三 地 址 指令 
三 地 址 代码 是 由 如 下 形式 的 指令 组 成 的 序列 
x = yopz 


其 中 x、y 和 z 可 以 是 名 字 、 常 量 或 由 编译 器 生成 的 临时 量 ; 而 op 表示 一 个 运算 符 。 

数组 将 由 下 面 的 两 种 变 体 指令 来 处 理 : 

aly] =z 

x=y[z] 
前 者 将 z 的 值 保存 到 x [y] 所 指示 的 位 置 上 , 而 后 者 则 将 y [z] 的 值 放 到 位 置 x 上 。 

三 地 址 指令 将 被 顺序 执行 , 但 是 当 遇 到 一 个 条 件 或 无 条 件 跳 转 指 令 时 , 执行 过 程 就 会 跳 转 。 
我 们 选择 下 面 的 指令 来 控制 程序 流 ; 

ifFalse x gotoL 如果 了 为 假 ， 下 一 步 执行 标号 为 L 的 指令 


ifTrue z gotoL 如果 了 为 真 ， 下 一 步 执行 标号 为 的 指令 
goto L 下 一 步 执行 标号 为 的 指令 


在 一 个 指令 前 加 上 前 缀 工 : 就 表示 将 标号 工 附加 到 该 指令 。 同 一 指令 可 以 同时 拥有 多 个 标号 。 
最 后 , 我 们 还 需要 一 个 拷贝 值 的 指令 。 如 下 的 三 地 址 指令 将 y 的 值 拷贝 至 x 中， 


X 二 y 
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语句 的 翻译 
通过 利用 跳 转 指令 实现 语句 内 部 的 控制 流 , 我 们 就 可 以 将 语句 转换 成 为 三 地 址 代码 。 图 2-42 
的 代码 布局 说 明了 对 语句 fexpr then seme, 的 翻译 。 该 代码 布局 中 的 跳 KA oe 
Se 对 expr 求 值 并 结 
转 指 令 果 存 放 到 x 中 的 代码 
ifFalse x goto after 


将 在 expr 的 值 为 false 时 跳 过 语句 seme, 对 应 的 翻译 结果 。 其 他 语句 的 








ifFalse z goto- afre] 








翻译 方法 是 类 似 的 ; 我 们 将 使 用 一 些 跳 转 指令 在 其 各 个 组 成 部 分 对 应 simh 的 代码 
的 代码 之 间 进行 跳 转 。 m 


为 了 具体 说 明 , 我 们 在 图 2-43 中 给 出 了 类 ARD. X yE 
Simi 的 一 个 子 类 ， 对 应 于 其 他 语句 的 类 也 是 Stmt 的 子 类 。Stmt 的 每 一 图 2- 和 2 站 语句 的 代码 布局 
个 子 类 (这 里 是 办 都 有 一 个 构造 函数 及 一 个 为 此 类 语句 生成 三 地 址 代码 的 丽 数 gen。 


class If extends Simt { 
Expr E; Stmt S; 
public J (Bzpr x, Stmt y) { E = x; S = y; after = newlabel(); } 
public void gen() { 
Expr n = E.rvalue(); 
emit( “ifFalse ” + n.toString() + “ goto” + after); 
S.gen(); 
emit(after + *:”); 











} 
图 2-43 类 和 中 的 函数 gen 生成 三 地 址 代码 
图 2-43 中 的 构造 函数 构建 了 并 语句 的 语法 树 结 点 。 它 有 两 个 参数 ， 一 个 表达 式 结 点 x 和 
一 个 语句 结 点 y。 它 们 被 分 别 存放 在 属性 已 和 S 中 。 同 时 , 这 个 构造 函数 调用 了 函数 newlable( )， 


给 属性 after 赋予 一 个 唯一 的 新 标号 。 这 个 标号 将 按照 图 2-42 所 示 的 布局 被 使 用 。 

一 且 源 程序 的 整个 抽象 语法 树 被 创建 完毕 ,函数 gen 在 此 抽象 语法 树 的 根 结 点 处 被 调用 。 在 
我 们 的 简单 语言 中 , 一 个 程序 就 是 一 个 语句 块 ， 所 以 这 棵 抽象 语法 树 的 根 结 点 就 代表 这 个 语句 块 
中 的 语 名 序列。 所 有 的 语句 类 都 有 一 个 gen 函数 。 

图 2-43 中 类 If BY gen 函数 的 伪 代 码 具 有 代表 性 。 它 调用 五 rvalue( ) 函数 来 翻译 表达 式 EC 即 
作为 计 语 名 的 组 成 部 分 的 布尔 值 表达 式 ), 并 保存 E. rvalue( ) 返 回 的 结果 结 点 。 我 们 稍 后 会 讨论 
表达 式 的 翻译 。 然 后 ,gen 函数 发 生 一 个 条 件 跳 转 指令 , 并 且 调 用 S. gen( ) 来 翻译 子 语句 So 

表达 式 的 翻译 

我 们 将 考虑 包含 二 目 运 算 符 op、 数 组 访问 和 赋值 运算 , 并 包含 常量 及 标识 符 的 表达 式 , 以 此 
来 说 明 对 表达 式 的 翻译 。 为 了 简单 起 见 , 我 们 要 求 在 数组 访问 y[z] 中 , y BAHR., XF 
表达 式 的 中 间 代 码 生成 的 详细 讨论 请 见 6.4 节 。 

我 们 将 采用 一 种 简单 的 方法 , 为 一 个 表达 式 的 语法 树 中 的 每 个 运算 符 结 点 都 生成 一 个 三 
地 址 指令 。 不 需要 为 标识 符 和 常量 生成 任何 代码 , 因为 它们 可 以 作为 地 址 出 现在 指令 中 。 如 
果 一 个 结 点 x 的 类 为 Expr, 其 运算 符 为 op, 我 们 就 发 出 一 个 指令 来 计算 结 点 x 上 的 值 , 并 将 此 
值 存放 到 一 个 由 编译 器 生成 的 “临时 ”名 字 ( 比 如 中 。 因 此 , i - j + 会 被 翻译 成 为 两 条 


指令 





© 这 个 简单 请 言 支持 a[ a[n]] , 但 是 不 支持 a[mj[n]。 请 注意 , a[ a[ n]] 是 形 如 a[ 包 的 访问 , 其 中 的 是 a[ nj。 
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tl=i-j 
t2=tl+k 


在 处 理 数组 访问 及 赋值 运算 时 要 区 分 左 值 和 右 值 。 例 如 , 对 于 2 * al[i]j,， 可 以 通过 计算 


ti=a fil 
t2=2 * t1 


但 是 , M al ii] 出 现在 一 个 赋值 表达 式 的 左边 时 ,我 们 不 能 简单 地 以 一 个 临时 量 来 蔡 换 a[ 1]。 
我 们 的 简单 方法 使 用 了 两 个 函数 value 及 rvalue, 它们 分 别 显示 在 图 2-44 和 图 2-45 中 。 当 函 


数 rvalue 被 应 用 于 一 个 非 叶子 结 点 x 时 , 它 生 成 一 些 指令 , 这 些 指 令 对 x 求 值 并 存放 到 一 个 临时 
EP, 然后 该 函数 返回 一 个 表示 此 临时 量 的 新 结 点 。 当 函数 value 被 应 用 于 一 个 非 叶 子 结 点 x 


时 , 它 也 会 生成 一 些 指令 , 这 些 指令 计算 x 之 下 的 各 个 子 树 。 然 后 这 个 函数 返回 代表 x 的 “地 址 ” 
的 新 结 点 。 
因为 函数 lvalue 要 处 理 的 情况 相对 较 少 , 我 们 首先 对 它 进行 描述 。 当 将 它 应 用 于 一 个 结 点 

时 ,如 果 此 结 点 对 应 于 一 个 标识 符 ( 即 x 的 类 是 Id), 那么 它 直 接 返回 x。 在 我 们 的 简单 语言 中 ， 
除 此 之 外 只 存在 一 种 情况 会 使 一 个 表达 式 拥 有 左 值 ， 即 结 点 x 代表 一 个 数组 访问 ， 比 如 a[ i]。 
在 这 种 情况 下 , 结 点 x 形 如 Access(y, z), 其 中 类 Access 是 类 Expr 的 子 类 , y 表示 被 访问 数组 的 名 
F, 而 z 表示 被 访问 元 素 在 该 数组 中 的 偏 移 量 (下 标 )。 在 图 2-44 所 示 的 伪 代 码 中 ,函数 lvalue 会 
在 必要 时 调用 raalue(z) 来 生成 计算 z 的 右 值 的 指令 。 然 后 它 创建 并 返回 一 个 新 的 Access 结 点 , 此 
结 点 包含 两 个 子 结 点 , 分别 对 应 于 数组 名 y 及 z 的 右 值 。 


‘Expr lvalue(x : Expr) { 
if ( zz 是 一 个 ld 结 点 ) return z; 
else 站 (4w 是 一 个 4ccess (yz) 结 点 ， 且 V 是 一 个 1d 结 点 ) { 
return new Access (y. rvalue(z)); 














} 
else error; 
} 
图 2-44 PRA lvalue 的 伪 代 码 
当 结 点 x 表示 数组 访问 a[ 2 * k] 时 ,lvalue(x%) 的 调用 将 生成 指令 





t=2*k 
并 返回 一 个 表示 alt 1 的 左 值 的 新 结 点 x', 其 中 1 是 一 个 新 的 临时 名 字 。 . 

具体 来 说 , lvalue 函数 将 运行 到 代码 

return new Access(y, rvalue(z) ); 
处 ,此 时 y 是 对 应 于 a 的 结 点 , z 是 对 应 于 表达 式 2 * k 的 结 点 。 对 rvalue (x) 的 调用 生成 了 表达 
式 2 k 的 代码 ( 即 三 地 址 语句 + = 2 * k), 并 返回 表示 临时 名 字 上 t 的 新 结 点 z。 这 个 结 点 就 成 


为 新 的 Access 结 点 x' 的 第 二 个 字段 的 值 。 口 
图 2-45 中 的 函数 rvalue 生成 指令 并 返回 一 个 (可 能 是 新 生成 的 ) 结 点 。 当 x 代表 一 个 标识 符 
或 常量 时 , rvalue 返回 本身。 在 其 他 情况 下 , 它 都 返回 一 个 对 应 于 新 的 临时 名 字 1 的 14 结 点 。 
各 种 情况 的 处 理 如 下 ; 
o 如 果 结 点 表示 y op z, 则 代码 首先 计算 y = rvalue (y) Bez! = rvalue (z) 。 它 创建 一 个 
新 的 临时 名 字 4 并 产生 -个 指令 1 = y opz (更 精确 地 说 , 生成 了 一 个 由 代表 1、y'、op 和 
z' 的 字符 串 组 合 而 成 的 指令 字符 串 ) 。 它 返回 一 个 对 应 于 标识 符 ! 的 结 点 。 


。 如 果 结 点 «表示 一 个 数组 访问 y[z] , 我 们 可 以 复 用 函数 values BROA jualue(x) 返 回 一 
个 数组 访问 y[2'], 其 中 二 代表 一 个 标识 符 , 它 保 存 了 该 数组 访问 的 偏 移 量 。 函 数 rvalue 
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会 创建 一 个 临时 变量 二 并 按照 : = YLz'"] 生 成 一 个 指令 , 最 后 返回 一 个 对 应 于 :的 结 点 。 
o 如 果 % 表 示 y = 2, 那么 代码 将 首先 计算 z = rvalue (z) 。 它 生成 一 条 计算 lvalue(y) = z 


的 指令 , 并 返回 结 点 z'。 








Expr rvalue(x : Expr) { 
站 (Zz 是 一 个 4 或 者 Constant 结 点 ) return T; 
else if (z 是 一 个 Op (op, y,z) 或 者 Rel(op,y,z) 结 点 ) { 
t= 新 的 临时 名 字 ; 
生成 对 应 于 上 = rvalue(y) op rualue(z) 的 指令 串 ; 
return 一 个 代表 上 + 的 新 结 点 ; 


else if ( rz 是 一 个 4ceess(y,z) A ) { 
t= 新 的 临时 名 字 ， 
USHA lvalue(z), 它 返 回 一 个 4ccess (y, z AJAA ; 
生成 对 应 于 t= Access (y, 2) 的 指令 串 ; 
return 一 个 代表 上 上 的 新 结 点 ; 


else if ( cẸ&—^ Assign (y, z) 结 点 ) { 
z' = rvalue(z); 
生成 对 应 于 lvelue(y) = z 的 指令 串 ; 


return 2z’; 








图 2-45 函数 rvalue 的 伪 代 码 





O ” 当 将 函数 rvalue 应 用 于 
a[i] = 2*afj-k] 


的 语法 树 时 , CHER 


t3=j-k 
t2=a[t3] 
ti=2%* t2 


a[i]= ti 

这 棵 语法 树 的 根 是 Assign 结 点 , 它 的 第 一 个 参数 是 ali], 第 二 个 参数 是 2 * a[j -k]。 因 
此 , 适用 value 函数 的 第 三 种 情况 ， 函 数 被 递归 地 应 用 于 2 * a[j -k]。 这 棍子 树 的 根 结 点 是 表 
示 * 的 Op 结 点 , 因此 rvalue 首先 创建 一 个 临时 变量 tl1, 然后 处 理 左 运算 分 量 2, 再 后 是 右 运算 分 
量 。 常 量 2 没有 生成 三 地 址 代码 , rvolue 返回 它 的 右 值 , 即 一 个 值 为 2 的 Constant 结 点 。 

右 运算 分 量 a[ j -k] 是 一 个 4ccess 结 点 , 因此 rvalue 创建 一 个 新 的 临时 变量 t+2, 然后 在 这 个 
结 点 上 调用 walue 函数 。 函 数 rvalue 被 递归 地 调用 来 处 理 表 达 式 j - k。 这 个 调用 的 副作用 是 创 
建 临 时 变量 t3, 然后 生成 三 地 址 语句 t3 =j -k。 接 着 ,函数 的 执行 返回 到 正在 处 理 a[j -k] 
的 函数 lvalue 的 活动 中 , 临时 名 字 t2 被 赋予 整个 数组 访问 表达 式 的 右 值 , 即 t2 =alt3]。 

现在 , 我 们 返回 到 处 理 Op 结 点 2 alj -k] 的 rvalue 的 活动 中 。 这 次 调用 已 经 创建 了 临时 
变量 t1 。 作 为 一 个 副作用 , rvalue 生成 了 一 条 执行 这 个 乘法 表达 式 的 三 地 址 指令 。 最 后 , 应 用 于 
整个 表达 式 的 rvalue 的 调用 活动 在 最 后 调用 value 来 处 理 左 部 ali], 然后 生成 了 一 条 三 地 址 指 


Salil =t1。 这 个 指令 把 这 个 赋值 表达 式 的 右 部 赋 给 左 部 。 回 
改进 表达 式 的 代码 


使 用 如 下 几 种 方法 , 我 们 可 以 改进 图 2-45 中 的 函数 value, 使 它 生 成 更 少 的 三 地 址 指令 : 
。 在 之 后 的 优化 阶段 减少 拷贝 指令 的 数目 。 例 如 , 对 于 指令 t = i + 1;i =t, MRK 
有 再 被 使 用 , 我 们 就 可 以 将 它们 合并 为 i = i + 1。 
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。 充分 考虑 上 下 文 的 情况 , 在 最 初生 成 指令 时 就 减少 生成 的 指令 。 例 如 ,如 果 一 个 三 地 址 
赋值 指令 的 左 部 是 一 个 数组 访问 alt], 那么 其 右 部 必然 是 一 个 名 字 、 常 量 或 临时 变量 ， 
它们 都 只 使 用 了 一 个 地 址 。 但 如 果 左 部 是 -一 个 名 字 r, 那么 其 右 部 可 以 是 一 个 使 用 两 个 
地 址 的 运算 y op zo 
我 们 可 以 按照 如 下 的 方式 来 避免 一 些 拷 贝 指 令 。 首 先 修改 翻译 函数 , 使 之 生成 一 个 部 分 完 
成 的 指令 , 该 指令 只 进行 计算 ,比如 计算 j +k, 但 并 不 确定 将 结果 保存 在 哪里 , 而 是 用 null 来 替 
代 结 果 地 址 : 
null = j +k (2.8) 
随后 ,这 个 空 的 结果 地 址 会 被 奉 换 为 适当 的 标识 符 或 临时 量 。 如 果 j + k 位 于 一 个 赋值 表达 
式 的 右 部 , 如 i =j +k, 那么 null 就 会 被 替换 为 标识 符 。 此 时 (2. 8 ) 就 变 成 
i=j+k 
但 如 果 j +k 是 一 个 子 表达 式 ,， 比 如 它 在 j+Kk+fl 中 , 那么 这 个 空 的 结果 地 址 会 被 蔡 换 成 一 
个 新 的 临时 变量 t, 并 且 生 成 一 个 新 的 部 分 指令 : 


t=j+k 
null =t + 1 


很 多 编译 器 想方设法 使 得 它 生成 的 代码 和 汇编 代码 专家 手写 的 一 样 好 , 甚至 更 好 。 如 果 使 
用 第 9 章 中 讨论 的 代码 优化 技术 , 那么 一 个 有 效 的 策略 是 首先 使 用 一 个 简单 的 中 间 代 码 生 成 方 
法 , 然后 依靠 代码 优化 器 来 消除 不 必要 的 指令 。 

2.8.5 2.8 节 的 练习 

#5) 2.8.1: C 语言 和 Java 语言 中 的 for 语句 具有 如 下 形式 : 

for (expri; expr}; expr, ) stmt 

第 一 个 表达 式 在 循环 之 前 执行 , 它 通 常 被 用 来 初始 化 循环 下 标 。 第 二 个 表达 式 是 一 个 测试 ， 
它 在 循环 的 每 次 迭代 之 前 进行 。 如 果 这 个 表达 式 的 结果 变 成 0, 就 退出 循环 。 循 环 本 身 可 以 被 看 
PERAJ] stmt exprs; |。 第 三 个 表达 式 在 每 一 次 迭代 的 末尾 执行 , 它 通 常用 来 使 循环 下 标 递增 。 
故 for 语句 的 含义 类 似 于 

expri; while(expr,) | stmt expra; | 
仿照 图 2-43 中 的 类 If, X for 语句 定义 一 个 类 For。 

练习 2. 8. 2: 程序 设计 语言 C 中 没有 布尔 类 型 。 试 说 明 C 语言 的 编译 器 可 能 使 用 什么 方法 
将 一 个 站 语句 翻译 成 为 三 地 址 代码 。 


2.9 第 2 章 总 结 


本 章 介绍 的 语法 制导 翻译 技术 可 以 用 于 构造 如 图 2-46 所 示 的 编译 器 的 前 端 。 

e 构造 一 个 语法 制导 翻译 器 要 从 源 语言 的 文法 开始 。 一 个 文法 描述 了 程序 的 层次 结构 。 文 
法 的 定义 使 用 了 称 为 终结 符号 的 基本 符号 和 称 为 非 终结 符号 的 变量 符号 。 这 些 符号 代表 
了 语言 的 构造 。 一 个 文法 的 规则 ， 即 产生 式 ， 由 一 个 作为 产生 式 头 或 产生 式 去 部 的 非 终 
AR, 以 及 称 为 产生 式 体 或 产生 式 右 部 的 终结 符号 / 非 终结 符号 序列 组 成 。 文 法 中 有 一 个 
非 终结 符 被 指派 为 开始 符号 。 

。 在 描述 一 个 翻译 器 时 , 在 程序 构造 中 附加 属性 是 非常 有 用 的 。 属 性 是 指 与 一 个 程序 构造 
关联 的 任何 量 值 。 因 为 程序 构造 是 使 用 文法 符号 来 表示 的 ,因此 属性 的 概念 也 被 扩展 到 
文法 符号 上 。 属 性 的 例子 包括 与 一 个 表示 数字 的 终结 符号 num 相关 联 的 整数 值 , 或 与 一 
个 表示 标识 符 的 终结 符号 id 相关 联 的 字符 囊 。 
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if( peek == ’\n’ ) line = line + 1; 
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(if) (() (id, "peek") (eq) (const, *\n’) ()) 
(id, "line") (assign) (id, "Line") (+) (num, 1) (;) 
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， if 1: t1 = (int) :An 
ra N , 2: ifFalse peek == t1 goto 4 
JN : TX 3: line = line + 1 
peek (int) line + i 
| TAAN 
ns line 1 


图 2-46 一 个 语句 的 两 种 可 能 的 翻译 结果 


e 词法 分 析 器 从 输入 中 逐个 读 取 字符 ,并 输出 一 个 词法 单元 的 流 , 其 中 词法 单元 由 一 个 终 
结 符号 以 及 以 属性 值 形式 出 现 的 附加 信息 组 成 。 在 图 2-46 中 , 词法 单元 被 写成 用 ( ) 括 起 
的 元 组 。 词 法 单元 (id,，"peek") 由 终结 符号 id 和 一 个 指向 包含 字符 串 " peck" 的 符号 表 
条 目的 指针 构成 。 翻 译 器 使 用 符号 表 来 存放 保留 字 和 已 经 遇 到 的 标识 符 。 

o 语法 分 析 要 解决 的 问题 是 指出 如 何 从 一 个 文法 的 开始 符号 推导 出 一 个 给 定 的 终结 符号 
串 。 推 导 的 方法 是 反复 将 某 个 非 终结 符 蔡 换 为 它 的 某 个 产生 式 的 体 。 从 概念 上 讲 ， 语 法 
分 析 器 会 创建 一 棵 语法 分 析 树 。 该 树 的 根 结 点 的 标号 为 文法 的 开始 符号 , 每 个 非 叶子 结 
点 对 应 于 一 个 产生 式 , 每 个 时 子 结 点 的 标号 为 一 个 终结 符号 或 空 串 e。 语 法 分 析 树 推导 
出 由 它 的 叶子 结 点 从 左 到 右 组 成 的 终结 符号 串 。 

o 使 用 被 称 为 预测 语法 分 析 法 的 自 顶 向 下 (从 语法 分 析 树 的 根 结 点 到 叶子 结 点 ) 方 法 可 以 手 
工 建立 高 效 的 语法 分 析 器 。 预 测 分 析 器 有 对 应 于 每 个 非 终结 符 的 子 过 程 。 该 过 程 的 过 程 
体 模拟 了 这 个 非 终结 符号 的 各 个 产生 式 。 只 要 在 输入 流 中 向 前 看 一 个 符号 , 就 可 以 无 二 
义 地 确定 该 过 程 体 中 的 控制 流 。 其 他 语法 分 析 方 法 见 第 4 章 。 

。 语法 制导 翻译 通过 在 文法 中 添加 规则 或 程序 片段 来 完成 。 在 本 章 中 , 我 们 只 考虑 了 综合 
属性 。 任 意 结 点 x 上 的 一 个 综合 属性 的 值 只 取决 于 v 的 子 结 点 (如 果 有 的 话 ) 上 的 属性 
值 。 语 法 制导 定义 将 规则 和 产生 式 相 关联 ,这 些 规则 用 于 计算 属性 值 。 语 法 制导 的 翻译 
方案 在 产生 式 体 中 嵌入 了 称 为 语义 动作 的 程序 片段 。 这 些 语义 动作 按照 语法 分 析 中 产生 
式 的 使 用 顺序 执行 。 

。 语法 分 析 的 结果 是 源 代码 的 一 种 中 间 表 示 形 式 , 称 为 中 间 代 码 。 图 2-46 列 出 了 中 间 代 码 
的 两 种 主要 形式 。 抽 象 语法 树 中 的 各 个 结 点 代表 了 程序 构造 ,一 个 结 点 的 子 结 点 给 出 了 
该 构造 有 意义 的 子 构造 。 另 一 种 表示 方法 是 三 地 址 代码 , 它 是 一 个 由 三 地 址 指令 组 成 的 
序列 ,其 中 每 个 指令 只 执行 一 个 运算 。 

。 符号 表 是 存放 有 关 标 识 符 的 信息 的 数据 结构 。 当 分 析 一 个 标识 符 的 声明 的 时 候 , 该 标识 
符 的 信息 被 放 入 符号 表 中 。 当 在 后 来 使 用 这 个 标识 符 时 ， 比 如 它 作 为 一 个 表达 式 的 因子 
使 用 时 , 语义 动作 将 从 符号 表 中 获取 这 些 信息 。 
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本 章 我 们 主要 讨论 如 何 构建 一 个 词法 分 析 器 。 如 果 要 手动 地 实现 词法 分 析 器 ,首先 建立 起 
每 个 词法 单元 的 词法 结构 图 或 其 他 描述 会 有 所 帮助 。 然 后 , 我 们 可 以 编写 代码 来 识别 输入 中 出 
现 的 每 个 词素 , 并 返回 识别 到 的 词法 单元 的 有 关 信 息 。 

我 们 也 可 以 通过 如 下 方式 自动 生成 一 个 词法 分 析 器 : 向 一 个 词法 分 析 器 生成 工具 (lexical-an- 
alyzer generator ) 描述 出 词素 的 模式 ,然后 将 这 些 模式 编译 为 具有 词法 分 析 器 功能 的 代码 。 这 种 方 
法 使 得 修改 词法 分 析 器 的 工作 变 得 更 加 简单 ， 因 为 我 们 只 需 改写 那些 受到 影响 的 模式 ， 无 需 改 写 
整个 程序 。 这 种 方法 还 加 快 了 词法 分 析 器 的 实现 速度 ,因为 程序 员 只 需要 在 很 高 的 模式 层次 上 
摘 述 软件 ， 就 可 以 依赖 生成 工具 来 生成 详细 的 代码 。 我 们 将 在 3. 5 节 中 介绍 一 个 名 为 Lex 的 词法 
.分 析 器 生成 工具 ( 它 的 一 个 最 新 的 变 体 称 为 Plex) 。 

在 介绍 词法 分 析 器 生成 工具 之 前 , 我 们 先 介绍 正则 表达 式 。 正 则 表达 式 是 一 种 可 以 很 方便 
地 描述 词素 模式 的 方法 。 我 们 将 介绍 如 何 对 正则 表达 式 进 行 转换 : 首先 转换 为 不 确定 有 穷 自 动 
机 ， 然 后 再 转换 为 确定 有 穷 自 动机 。 后 两 种 表示 方法 可 以 作为 一 个 “驱动 程序 "的 输入 。 这 个 驱 
动 程序 就 是 一 段 模拟 这 些 自动 机 的 代码 , 它 使 用 这 些 自动 机 来 确定 下 一 个 词法 单元 。 这 个 驱动 
程序 以 及 对 自动 机 的 规约 形成 了 词法 分 析 器 的 核心 部 分 。 


3.1 词法 分 析 器 的 作用 


词法 分 析 是 编译 的 第 一 阶段 。 词 法 分 析 器 的 主要 任务 是 读 人 源 程序 的 输入 字符 、 将 它们 组 
成 词素 ,生成 并 输出 一 个 词法 单元 序列 ， 每 个 词法 单元 对 应 于 一 个 词素 。 这 个 词法 单元 序列 被 输 
出 到 语法 分 析 器 进行 语法 分 析 。 词 法 分 析 器 通常 还 要 和 符号 表 进 行 交互 。 当 词法 分 析 器 发 现 了 
一 个 标识 符 的 词素 时 ， 它 要 将 这 个 词素 添加 到 符号 表 中 。 在 某 些 情况 下 ,词法 分 析 器 会 从 符号 表 
中 读 取 有 关 标 识 符 种 类 的 信息 ， 以 确定 向 语法 分 析 髓 传送 哪个 词法 单元 。 

这 种 交互 过 程 在 图 3-1 中 给 出 。 通 常 , 交互 是 由 语法 分 析 器 调用 词法 分 析 器 来 实现 的 。 图 中 
的 命令 getNextToken 所 指示 的 调用 使 得 词法 分 析 器 从 它 的 输入 中 不 断 读 取 字符 , 直到 它 识别 出 下 
一 个 词素 为 止 。 词 法 分 析 器 根据 这 个 词素 生成 下 一 个 词法 单元 并 返回 给 语法 分 析 器 。 


词法 单元 





输出 至 语 
义 分 析 


图 3-1 词法 分 析 器 与 语法 分 析 器 之 间 的 交互 

词法 分 析 器 在 编译 器 中 负责 读 取 源 程序 , 因此 它 还 会 完成 一 些 识别 词素 之 外 的 其 他 任务 。 
任务 之 一 是 过 滤 掉 源 程序 中 的 注释 和 空白 (空格 . 换行 符 、 制 表 符 以 及 在 输入 中 用 于 分 隔 词法 音 
元 的 其 他 字符 ) ; 另 一 个 任务 是 将 编译 器 生成 的 错误 消息 与 源 程序 的 位 置 联系 起 来 。 例 如 ,词法 
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分 析 器 可 以 负责 记录 过 到 的 换行 符 的 个 数 ， 以 便 给 每 个 出 错 消息 赋予 一 个 行 号 。 在 某 些 编译 器 
中 , 词法 分 析 器 会 建立 源 程 序 的 一 个 拷贝 , 并 将 出 错 消息 插入 到 适当 位 置 。 如 果 源 程序 使 用 了 一 
个 宏 预 处 理 器 , 则 宏 的 扩展 也 可 以 由 词法 分 析 器 完成 。 

有 时 , 词法 分 析 器 可 以 分 成 两 个 级 联 的 处 理 阶段 ; 

1) 扫描 阶段 主要 负责 完成 一 些 不 需要 生成 词法 单元 的 简单 处 理 ， 比 如 删除 注释 和 将 多 个 连 
续 的 空白 字符 压缩 成 一 个 字符 。 

2) 词法 分 析 阶 段 是 较为 复杂 的 部 分 , 它 处 理 扫描 阶段 的 输出 并 生成 词法 单元 。 

3. 1.1 词法 分 析 及 语法 分 析 

把 编译 过 程 的 分 析 部 分 划分 为 词法 分 析 和 和 语法 分 析 阶 段 有 如 下 几 个 原因 : 

1) 最 重要 的 考虑 是 简化 编译 器 的 设计 。 将 词法 分 析 和 语法 分 析 分 离 通 常 使 我 们 至 少 可 以 简 
化 其 中 的 一 项 任务 。 例 如 , 如果 一 个 语法 分 析 器 必须 把 空白 符 和 注释 当 作 语 法 单元 进行 处 理 , 那 
么 它 就 会 比 那些 假设 空白 和 注释 已 经 被 词法 分 析 器 过 滤 掉 的 处 理 器 复杂 得 多 。 如 果 我 们 正在 设 
计 一 个 新 的 语言 , 将 词法 和 语法 分 开 考 虑 有 助 于 我 们 得 到 一 个 更 加 清晰 的 语言 设计 方案 。 

2) 提高 编译 器 的 效率 。 把 词法 分 析 器 独立 出 来 使 我 们 能 够 使 用 专用 于 词法 分 析 任务 、 不 进行 语法 
分 析 的 技术 。 此 外 , 我 们 可 以 使 用 专门 的 用 于 读 取 输入 字符 的 缓冲 技术 来 显著 提高 编译 器 的 速度 。 

3) 增强 编译 器 的 可 移植 性 。 输 入 设备 相关 的 特殊 性 可 以 被 限制 在 词法 分 析 器 中 。 

3.1.2 词法 单元 、 模 式 和 词素 

在 讨论 词法 分 析 时 , 我 们 使 用 三 个 相关 但 有 区 别 的 术语 : 

e 词法 单元 由 一 个 词法 单元 名 和 一 个 可 选 的 属性 值 组 成 。 词 法 单元 名 是 一 个 表示 某 种 词法 
单位 的 抽象 符号 ， 比 如 一 个 特定 的 关键 字 , 或 者 代表 一 个 标识 符 的 输入 字符 序列 。 词 法 
单元 名 字 是 由 语法 分 析 器 处 理 的 输入 符号 。 在 后 面 的 内 容 中 , 我 们 通常 使 用 黑体 字 给 出 
词法 单元 名 。 我 们 将 使 用 词法 单元 的 名 字 来 引用 一 个 词法 单元 。 
模式 描述 了 一 个 词法 单元 的 词素 可 能 具有 的 形式 。 当 词法 单元 是 一 个 关键 字 时 , 它 的 模 
式 就 是 组 成 这 个 关键 字 的 字符 序列 。 对 于 标识 符 和 其 他 词法 单元 , 模式 是 一 个 更 加 复杂 
的 结构 , 它 可 以 和 很 多 符号 串 匹 配 。 
词素 是 源 程序 中 的 一 个 字符 序列 ， 它 和 某 个 词法 单元 的 模式 匹配 ,并 被 词法 分 析 器 识别 
为 该 词法 单元 的 一 个 实例 。 

AR 图 3-2 给 出 了 一 些 常见 的 词法 单元 、 非 正式 描述 的 词法 单元 的 模式 , 并 给 出 了 一 些 示 
例 词 素 。 下 面 说 明 上 述 概念 在 实际 中 是 如 何 应 用 的 。 在 C 语句 
printf("Total =% d\n",score); 


中 , printf Ñ score 都 是 和 词法 单元 id 的 模式 匹配 的 词素 , 而 “Total =% d n” 则 是 一 个 和 


















































literal 匹配 的 词素 。 O 

词法 单元 非 正式 描述 词素 示例 

if 字符 于 f if 

else 字符 e, 1, s, e else 

comparison | < i > a <= >= Re == W f= <=, I= 

id 字母 开头 的 字母 / 数字 串 pi, score, D2 

number 任何 数字 常量 3.14159, 0, 6.02e23 

literal 在 两 个 “之 闻 ， 除 " 以 外 的 任何 字符 | "core dumped" 


图 3-2 词法 单元 的 例子 
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在 很 多 程序 设计 语言 中 , 下 面 的 类 别 材 盖 了 大 部 分 或 所 有 的 词法 单元 ; 

1) 每 个 关键 字 有 一 个 词法 单元 。 一 个 关键 字 的 模式 就 是 该 关键 字 本 身 。 

2) 表示 运算 符 的 词法 单元 。 它 可 以 表示 单个 运算 符 , 也 可 以 像 图 3-2 中 的 comparison 那样 , 表示 
一 类 运算 符 。 | 

3) 一 个 表示 所 有 标识 符 的 词法 单元 。 

4) 一 个 或 多 个 表示 常量 的 词法 单元 ， 比 如 数字 和 字面 值 字符 串 。 

5) 每 一 个 标点 符号 有 一 个 词法 单元 , 比如 左右 括号 、 逗 号 和 分 号 。 

3.1.3 词法 单元 的 属性 

如 果 有 多 个 词素 可 以 和 一 个 模式 匹配 , 那么 词法 分 析 器 必须 向 编译 器 的 后 续 阶 段 提供 有 关 
被 匹配 词素 的 附加 信息 。 例 如 , 0 和 1 都 能 和 词法 单元 number 的 模式 匹配 , 但 是 对 于 代码 生成 
Sia, 至 关 重要 的 是 知道 在 源 程 序 中 找到 了 哪个 词素 。 因 此 , 在 很 多 情况 下 , 词法 分 析 器 不 仅 
仅 向 语法 分 析 器 返回 一 个 词法 单元 名 字 , 还 会 返回 一 个 描述 该 词法 单元 的 词素 的 属性 值 。 词 法 
单元 的 名 字 将 影响 语法 分 析 过 程 中 的 决定 , 而 这 个 属性 则 会 影响 语法 分 析 之 后 对 这 个 词法 单元 
的 翻译 。 

我 们 假设 一 个 词法 单元 至 多 有 一 个 相关 的 属性 值 ,当然 这 个 属性 值 可 能 是 一 个 组 合 了 多 种 
信息 的 结构 化 数据 。 最 重要 的 例子 是 词法 单元 id, 我 们 通常 会 将 很 多 信息 和 它 关联 。 一 般 来 说 ， 
和 一 个 标识 符 有 关 的 信息 一 一 例如 它 的 词素 、 类 型 、 它 第 一 次 出 现 的 位 置 (在 发 出 一 个 有 关 该 标 
识 符 的 错误 消息 时 需要 使 用 这 个 信息 ) 一 一 都 保存 在 符号 表 中 。 因 此 , 一 个 标识 符 的 属性 值 是 一 
个 指向 符号 表 中 该 标识 符 对 应 条 目的 指针 。 














识别 词法 单元 时 的 束 手 问题 

如 果 给 定 一 个 描述 了 菜 词法 单元 的 词素 的 模式 ,在 与 之 匹配 的 词素 出 现在 输入 中 时 识别 
出 匹配 的 词素 是 相对 简单 的 。 然 而 ,在 某 些 程序 设计 语言 中 ,要 判断 是 否 识别 到 一 个 和 某 词 法 
单元 匹配 的 词素 并 不 是 一 件 轻而易举 的 事 。 下 面 的 例子 来 自 Fortran 语言 的 固定 格式 (fixed- 
format) 程序 。Fortran 90 中 仍然 支持 固定 格式 。 在 语句 

DOS I = 1.25 
中 ,在 我 们 看 到 1 后 的 小 数 点 之 前 ,我 们 并 不 能 确定 DO5I 是 第 一 个 词素 , 即 一 个 标识 符 词法 
单元 的 实例 。 注 意 ,在 Fortran 语言 的 固定 格式 中 ,空格 是 被 忽略 的 (这 是 一 种 过 时 的 惯例 )。 
假如 我 们 看 到 的 是 一 个 逗号 ,而 不 是 小 数 点 ,那么 我 们 就 得 到 了 一 个 do 语句 

DOS I = 1,25 


在 这 个 语句 中 ,第 一 个 词素 是 关键 字 Do。 


WEE Fortran 语句 


E=M* C ** 2 
中 的 词法 单元 名 字 和 相关 的 属性 值 可 写成 如 下 的 名 字 - 属 性 对 序列 : 
<id, 指向 符号 表 中 E 的 条 目的 指针 > 
<assign_op> 
<id, 指向 符号 表 中 X 的 条 目的 指针 > 
<mult_op> 
<id, 指向 符号 表 中 C 的 条 目的 指针 > 
<exp_op> 
<number, 整数 值 2> 


注意 , 在 某 些 对 中 , 特别 是 运算 符 、 标 点 符号 和 关键 字 的 对 中 , 不 需要 有 属性 值 。 在 这 个 例子 中 ， 
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词法 单元 number 有 一 个 整数 属性 值 。 在 实践 中 ,编译 器 将 保存 一 个 代表 该 常量 的 字符 串 ， 并 将 
一 个 指向 该 字符 串 的 指针 作为 number 的 属性 值 。 o 
3.1.4 词法 错误 

如 果 没 有 其 他 组 件 的 帮助 , 词法 分 析 器 很 难 发 现 源 代 码 中 的 错误 。 比 如 , 当 词法 分 析 器 在 C 
程序 片断 

fi(a==f(x)).. 
中 第 一 次 遇 到 fi 时 , 它 无 法 指出 fi 究竟 是 关键 字 if 的 误 写 还 是 一 个 未 声明 的 函数 标识 符 。 由 
于 fi 是 标识 符 id 的 一 个 合法 词素 , 因此 词法 分 析 器 必须 向 语法 分 析 器 返回 这 个 id 词法 单元 , 而 
让 编译 器 的 另 一 个 阶段 (在 这 个 例子 里 是 语法 分 析 器 ) 去 处 理 这 个 因为 字母 颠倒 而 引起 的 错误 。 

然而 , 假设 出 现 所 有 词法 单元 的 模式 都 无 法 和 剩余 输入 的 某 个 前 绥 相 匹配 的 情况 , 此 时 词法 
分 析 器 就 不 能 继续 处 理 输入 。 当 出 现 这 种 情况 时 , 最 简单 的 错误 恢复 策略 是 “ 怒 懂 模式 "恢复 。 
我 们 从 剩余 的 输入 中 不 断 删 除 字符 ,直到 词法 分 析 器 能 够 在 剩余 输入 的 开头 发 现 一 个 正确 的 词 
法 单元 为 止 。 这 个 恢复 技术 可 能 会 给 语法 分 析 器 带 来 混乱 。 但 是 在 交互 计算 环境 中 , 这 个 技术 
已 经 足够 了 。 

可 能 采取 的 其 他 错误 恢复 动作 包括 : 

1) 从 剩余 的 输入 中 删除 一 个 字符 。 

2) 向 剩余 的 输入 中 插 人 一 个 遗漏 的 字符 。 

3) 用 一 个 字符 来 替换 另 一 个 字符 。 

4) 交换 两 个 相 邻 的 字符 。 

这 些 变换 可 以 在 试图 修复 错误 输入 时 进行 。 最 简单 的 策略 是 看 一 下 是 否 可 以 通过 一 次 变换 
将 剩余 输入 的 某 个 前 绥 变 成 一 个 合法 的 词素 。 这 种 策略 还 是 有 道理 的 ， 因 为 在 实践 中 , 大 多 数 词 
法 错误 只 涉及 一 个 字符 。 另 外 一 种 更 加 通用 的 改正 策略 是 计算 出 最 少 需要 多 少 次 变换 才能 够 把 
一 个 源 程 序 转换 成 为 一 个 只 包含 合法 词素 的 程序 。 但 是 在 实践 中 发 现 这 种 方法 的 代价 太 高 ， 不 
值得 使 用 。 

3.1.5 3.1 节 的 练习 
练习 3.1.1: 根据 3.1.2 节 中 的 讨论 , 将 下 面 的 C ++ 程序 
float limitedSquare(x){float x; 

/* returns x-squared, but never more than 100 */ 


return (x<=-10.0| |x>=10.0)?100:x*x; 
} 


划分 成 正确 的 词素 序列 。 哪 些 词素 应 该 有 相关 联 的 词法 值 ? 应 该 具有 什么 值 ? 

练习 3.1.2: 像 HTML 或 XML 之 类 的 标记 语言 不 同 于 传统 的 程序 设计 语言 , 它们 要 么 包含 
有 很 多 标点 符号 (标记 ), 如 HTML, 要 么 使 用 由 用 户 自 定义 的 标记 集合 , 如 XML。 而 且 标 记 还 可 
以 带 有 参数 。 请 指出 如 何 把 如 下 的 HTML 文档 


Here is a photo of <B>my house</B>; 

<P><IMG SRC = "house. gif"><BR> 

See <A HREF = "morePix.html">More Pictures</A> if you 
liked that one.<P> 


划分 成 适当 的 词素 序列 。 哪 些 词素 应 该 具有 相关 联 的 词法 值 ? 应 该 具有 什么 样 的 值 ? 
3.2 输入 缓冲 


在 讨论 如 何 识别 输入 流 中 的 词素 之 前 , 我 们 首先 讨论 几 种 可 以 加 快 源 程序 读 人 速度 的 方法 。 
源 程序 读 人 虽然 简单 , 却 很 重要 。 由 于 我 们 常常 需要 查看 一 个 词素 之 后 的 若干 字符 才能 够 确定 
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是 否 找到 了 正确 的 词素 , 因此 这 个 任务 变 得 有 些 困难 。 在 3. 1 节 的 “识别 词法 单元 时 的 未 手 问 
题 "中 给 出 了 一 个 极端 的 例子 。 但 是 在 实践 中 , 很 多 情况 下 我 们 的 确 需 要 至 少 向 前 看 一 个 字符 。 
比如 , 我 们 只 有 读 取 到 一 个 非 字母 或 数字 的 字符 之 后 才能 确定 我 们 已 经 到 达 一 个 标识 符 的 末尾 ， 
因此 这 个 字符 不 是 id 的 词素 的 一 部 分 。 在 C 语言 中 , 像 ~- 、= 或 < 这 样 的 单字 符 运 算 符 也 有 可 
能 是 -> == 或 <= 这 样 的 双 字符 运算 符 的 开始 字符 。 因 此 ,我 们 将 介绍 一 种 双 缓 冲 区 方案 , 这 
种 方案 能 够 安全 地 处 理 向 前 看 多 个 符号 的 问题 。 然 后 我 们 将 考虑 一 种 改进 方法 。 这 种 方法 使 用 
“哨兵 标记 ”来 节约 用 于 检查 缓冲 区 末端 的 时 间 。 
3.2.1 缓冲 区 对 
由 于 在 编译 一 个 大 型 源 程序 时 需要 处 理 大 量 的 字符 , 处 理 这 些 字符 需要 很 多 的 时 间 , 因此 开 
发 了 一 些 特殊 的 缓冲 技术 来 减少 用 于 处 理 单个 输入 字符 的 时 间 开销 。 一 种 重要 的 机 制 就 是 利用 
两 个 交替 读 人 的 缓冲 区 , 如 图 3-3 所 示 。 
TEN E i RREA 
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图 3-3 使 用 一 对 输入 缓冲 区 
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每 个 缓冲 区 的 容量 都 是 N EGE NETRA), 如 4096 字 节 。 我 们 可 以 使 
用 系统 读 取 命令 一 次 将 个 字符 读 人 到 缓冲 区 中 ,而 不 是 每 读 人 一 个 字符 调用 一 次 系统 读 取 命 
令 。 如 果 输 入 文件 中 的 剩余 字符 不 足 N 个, 那么 就 会 有 一 个 特殊 字符 (用 eof 表示 ) 来 标记 源 文 
件 的 结束 。 这 个 特殊 字符 不 同 于 任何 可 能 出 现在 源 程序 中 的 字符 。 
程序 为 输入 维护 了 两 个 指针 : 

1) lexemeBegin 指针 : 该 指针 指向 当前 词素 的 开始 处 。 当 前 我 们 正 试 图 确定 这 个 词 
素 的 结尾 。 

2) forward 指针 : 它 一 直 向 前 扫描 ,直到 发 现 某 个 模式 被 匹配 为 止 。 做 出 这 个 决定 所 依据 
的 策略 将 在 本 章 的 其 余部 分 中 讨论 。 

一 旦 确定 了 下 一 个 词素 ,forward 指针 将 指向 该 词素 结尾 的 字符 。 词 法 分 析 器 将 这 个 词素 
作为 某 个 返回 给 语法 分 析 器 的 词法 单元 的 属性 值 记 录 下 来 。 然 后 使 lexemeBegin 指针 指向 刚 
刚 找到 的 词素 之 后 的 第 一 个 字符 。 在 图 3-3 中 , RANAR, forward 指针 已 经 越过 下 一 个 词素 
+x (Fortran 的 指数 运算 符 ) 。 在 处 理 完 这 个 词素 后 ， 它 将 会 被 左 移 一 个 位 置 。 

K forward 指针 前 移 要 求 我 们 首先 检查 是 否 已 经 到 达 某 个 缓冲 区 的 末尾 。 如 果 是 , 我们 必 
须 将 N 个 新 字符 读 到 另 一 个 缓冲 区 中 , 且 将 forward 指针 指向 这 个 新 载 人 字符 的 缓冲 区 的 头 
部 。 只 要 我 们 从 不 需要 越过 实际 的 词素 向 前 看 很 远 , 以 至 于 这 个 词素 的 长 度 加 上 我 们 向 前 看 的 
距离 大 于 N, 我 们 就 决 不 会 在 识别 这 个 词素 之 前 覆盖 掉 这 个 尚 在 缓冲 区 中 的 词素 。 

3.2.2 ”哨兵 标记 

如 果 我 们 采用 上 一 节 中 撒 述 的 方案 , 那么 在 每 次 向 前 移动 forward 指针 时 , 我 们 都 必须 检 
查 是 否 到 达 了 缓冲 区 的 末尾 。 若 是 , 那么 我 们 必须 加 载 另 一 个 缓冲 区 。 因 此 每 读 人 一 个 字符 , 我 
们 需要 做 两 次 测试 : 一 次 是 检查 是 否 到 达 缓 冲 区 的 末尾 , 另 一 次 是 确定 读 人 的 字符 是 什么 (后 者 
可 能 是 一 个 多 路 分 支 选 择 语 句 ) 。 如 果 我 们 扩展 每 个 缓冲 区 , 使 它们 在 末尾 包含 一 个 “哨兵 ” 
(sentinel) 字符 , 我 们 就 可 以 把 对 缓冲 区 末端 的 测试 和 对 当前 字符 的 测试 合 二 为 一 。 这 个 哨兵 字 
符 必须 是 一 个 不 会 在 源 程序 中 出 现 的 特殊 字符 , 一 个 自然 的 选择 就 是 字符 eof, 
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图 3-4 显示 的 缓冲 区 安排 与 图 3-3 一 致 ， 只 是 加 入 了 “哨兵 标志 ”字符 。 请 注意 ,eof 仍然 可 
以 用 来 标记 整个 输入 的 结尾 。 任 何不 是 出 现在 某 个 缓冲 区 末尾 的 eof 都 表示 到 达 了 输入 的 结尾 。 
图 3-5 总 结 了 前 移 forward 指针 的 算法 。 请 注意 , 我 们 在 大 部 分 情况 下 只 需要 进行 一 次 测试 就 
可 以 根据 forward 所 指向 的 字符 完成 多 路 分 支 跳 转 。 只 有 当 我 们 确实 处 于 缓冲 区 末尾 或 输入 末尾 
时 , 才 和 需要 进行 更 多 的 测试 。 
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f forward 
lexemeBegin 


图 3-4 各 个 缓冲 区 末端 的 “哨兵 标记 ” 





switch ( *forward ++ ) { 
case eof: 
if (forward 在 第 一 个 缓冲 区 末尾 ) { 
装载 第 二 个 缓冲 区 ; 
forward= 第 二 个 缓冲 区 的 开头 : 


} 

else if (forward 在 第 二 个 缓冲 区 末尾 ) { 
装载 第 一 个 缓冲 区 ; 
forward= 第 一 个 缓冲 区 的 开头 ; 


} 
else /* 绥 冲 区 内 部 的 eof 标记 输入 结束 * / 
终止 词法 分 析 
break; 
其 他 字符 的 情况 














图 3-5 带 有 哨兵 标记 的 forward 指针 移动 算法 


3.3 词法 单元 的 规约 


正则 表达 式 是 一 种 用 来 描述 词素 模式 的 重要 表示 方法 。 虽 然 正则 表达 式 不 能 表达 出 所 有 可 
能 的 模式 , 但 是 它们 可 以 高 效 地 描述 在 处 理 词法 单元 时 要 用 到 的 模式 类 型 。 在 这 一 节 中 , 我 们 将 
研究 正则 表达 式 的 形式 化 表示 方法 。 在 3. 5 节 中 , 我 们 将 看 到 如 何 将 这 些 表达 式 运 用 到 词法 分 析 
器 生成 工具 中 。 然 后 , 3.7 节 显 示 了 如 何 将 正则 表达 式 转换 成 能 够 识别 所 描述 的 词法 单元 的 自动 
机 , 并 由 此 建立 一 个 词法 分 析 器 。 





我 们 会 不 会 用 完 缓冲 区 空间 ? 
在 大 多 数 现代 程序 设计 语言 中 , 词素 很 短 ,向 前 看 一 到 两 个 字符 就 能 够 确定 一 个 词素 , 所 
以 数 千 字 节 大 小 的 缓冲 区 就 已 经 足够 了 。 使 用 3.2.1 节 中 介绍 的 双 缓 冲 区 方案 肯定 没 问 题 。 
但 是 仍然 存在 一 些 风险 。 比 如 ， 如果 字符 串 包含 很 多 行 , 那么 我 们 就 有 可 能 面临 单个 词素 的 
长 度 超过 N 的 情况 。 为 了 避免 长 字符 串 引 起 的 问题 ,我 们 可 以 把 它们 看 作 不 同 组 成 部 分 的 连 
接 ,每 个 组 成 部 分 对 应 于 该 字符 吕 的 一 行 。 比 如 , 在 Jaa 语言 中 , 人 们 习惯 于 将 一 个 字符 串 写 
成 多 个 部 分 , 每 个 部 分 占 一 行 , 并 在 每 个 部 分 的 结尾 加 上 运算 符 + , 将 它们 连接 起 来 。 
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当 需 要 向 前 看 任意 多 个 字符 时 ,就 会 出 现 一 个 更 加 严重 的 问题 。 比 如 , 像 PLI 这 样 的 请 
言 没 有 将 关键 字 作 为 保留 字 来 处 理 , 也 就 是 说 , 你 可 以 使 用 一 个 和 某 个 关键 字 ( 比如 DE- 
CLARE) 同 名 的 标识 符 。 当 词法 分 析 器 处 理 以 DECLARE(ARG1 , ARG2 ，…… 开头 的 PL/I 程序 
的 文本 时 , 它 不 能 确定 DECLARE 究竟 是 一 个 关键 字 ( 此 时 后 面 的 ARG1 等 是 被 声明 的 变量 ) ， 
还 是 一 个 带 有 参数 的 过 程 名 。 因 为 这 个 原因 , 大 多 数 现 代 程 序 设 计 语 言 都 保留 关键 字 。 然 
i, 如 果 不 保留 关键 字 , 我 们 可 以 把 像 DECLARE 这 样 的 关键 字 当 作 一 个 二 义 性 的 标识 符 , 由 
语法 分 析 器 来 解决 这 个 问题 。 此 时 语法 分 析 器 就 需要 在 符号 表 中 查询 有 关 信 息 。 








3. 3. 1 EMER 
FER (alphabet) 是 一 个 有 限 的 符号 集合 。 符 号 的 典型 例子 包括 字母 、 数 位 和 标点 符号 。 集 

ALO, 1| 是 二 进 制 字母 表 (binary alphabet), ASCH 是 字母 表 的 一 个 重要 例子 , 它 被 用 于 很 多 软件 

系统 中 。Unicode 包含 了 大 约 100000 个 来 自 世界 各 地 的 字符 , 它 是 字母 表 的 另 一 个 重要 例子 。 





l 实现 多 路 分 支 
我 们 也 许 会 认为 图 3-5 的 算法 中 的 switch 需要 执行 很 多 步 ， 而 且 将 eof 分 支 放 在 开头 也 
不 是 明智 的 选择 。 但 事实 上 , 我 们 按照 什么 顺序 列 出 针对 各 个 字符 的 case 并 不 重要 。 在 实践 
中 , 可 以 用 一 个 以 字符 为 下 标的 地 址 数组 来 存放 对 应 于 各 个 case 的 指令 地 址 , 并 根据 此 数组 
中 找到 的 目标 地 址 一 次 完成 跳 转 。 














某 个 字母 表 上 的 一 个 串 (string) 是 该 字母 表 中 符号 的 一 个 有 穷 序 列 。 在 语言 理论 中 ,术语 
“AIP” USS? 常常 被 当 作 ”“ 串 "的 同义词 。 串 * 的 长 度 , 通常 记 作 1s1,， 是 指 s 中 符号 出 现 的 次 数 。 
例如 , banana 是 一 个 长 度 为 6 KH. SF (empty string) 是 长 度 为 0 的 串 , Ale 表示 。 

语言 (language) 是 某 个 给 定 字母 表 上 一 个 任意 的 可 数 的 串 集 合 。 这 个 定义 非常 宽泛 。 根 据 这 
个 定义 , 像 空 集 8 和 仅 包 含 空 串 的 集合 ej 都 是 语言 。 所 有 语法 正确 的 C 程序 的 集合 ,以 及 所 有 
语法 正确 的 英语 句子 的 集合 也 都 是 语言 , 虽然 后 两 种 语言 难以 精确 地 描述 。 注 意 , 这 个 定义 并 没 
有 要 求 语言 中 的 串 一 定 具 有 某 种 含义 。 定 义 串 的 “含义 "的 方法 将 在 第 5 章 中 讨论 。 








串 的 各 部 分 的 术语 

下 面 是 一 些 与 串 相 关 的 常用 术语 : 

1) Bs 的 前 级 (prefix) 是 从 :的 尾部 删除 0 个 或 多 个 符号 后 得 到 的 串 。 例 如 ,ban、ba- 
nana 和 和 € 是 banana MATA. 

2) 串 s WER (suffix) EA s 的 开始 处 删除 0 个 或 多 个 符号 后 得 到 的 串 。 例 如 ，nana、 
banana 和 e 是 banana MGB. 

3) Æ s 的 子 串 (substring) 是 删除 s 的 某 个 前 级 和 某 个 后 级 之 后 得 到 的 串 。 例 如 ,bnana、 
nan il e 是 banana 的 子 串 。 

4) Bs KHA me) WA. RR. AT ROSE s 的 既 不 等 于 e, 也 不 等 于 * 本身 的 前 组 、 
BAF BR 

5) E s 的 子 序列 (supsequence) 是 从 * 中 删除 0 个 或 多 个 符号 后 得 到 的 串 , 这 些 被 删除 的 

| 符号 可 能 不 相 邻 。 例 如 ,baan # banana 的 一 个 子 序 列 。 








如 果 * Aly EB, 那么 x 和 y 的 连接 (concatenation)( 记 作 xy) 是 把 y 附加 到 x 后 面 而 形成 的 
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Ho fill, 如 果 * = aog H y=house, 那么 xy = Goghouse。 空 串 是 连接 运算 的 单位 元 ， 也 就 是 
说 ,对 于 任何 串 s 都 有 , se =€@s =s。 

如 果 把 两 个 串 的 连接 看 成 是 这 两 个 串 的 “乘积 ”, 我 们 可 以 定义 串 的 “指数 "运算 如 下 : 定义 
He, 并 且 对 于 i>0, 为 % 1s。 朵 为 es=y, MILAM s! =s, =s, 53 =s3， 依 此 类 推 。 
3.3.2 语言 上 的 运算 

在 词法 分 析 中 , 最 重要 的 语言 上 的 运算 是 并 、 连 接 和 闭 包 运算 。 图 3-6 给 出 了 这 些 运 算 的 正 
式 定 义 。 并 运算 是 常见 的 集合 运算 。 语 言 的 连接 就 是 以 各 种 可 能 的 方式 ,从 第 一 个 语言 中 任 取 
一 个 串 , 再 从 第 二 个 语言 任 取 一 个 串 , 然后 将 它们 连接 后 得 到 的 所 有 串 的 集合 。 一 个 语言 上 的 
Kleene 14] & (closure), 记 为 L* ,就 是 将 工人 连接 0 次 或 多 次 后 得 到 的 串 集 。 注 意 , L, OR Le 
接 0 次 得 到 的 集合 ”, WELA fel, FE L 被 归纳 地 定义 为 L"!L。 最 后 , 上 的 正 闭 包 ,( 记 为 
L*) 和 Kleene 闭 包 基 本 相同 , 但 是 不 包含 1。 也 就 是 说 , 除非 e REL, 否则 e 不 属于 上 1 。 


工程 MM 的 并 LUM = {s | s AFLs RF M} 


LEM 的 连接 IM={st]sRFLA 上 属于 























Lid Kleene WIE Lt =US,_ Li 
工 的 正 闭 包 L* =U% Lt 














图 3-6 语言 上 的 运算 的 定义 

EER 人 表示 字 母 的 集合 {A, B, =, Z,a, b, =, z}, 令 了 表示 数位 的 集合 10， 
1,…, 9} 0 我 们 可 以 用 两 种 不 同 但 等 价 的 方式 来 考虑 L 和 D。 一 种 方法 是 将 上 看 成 是 大 、 小 写字 
母 组 成 的 字母 表 , 将 D 看 成 是 10 个 数位 组 成 的 字母 表 。 另 一 种 方法 是 将 虐 和 D 看 作 语言 , 它们 
的 所 有 串 的 长 度 都 为 一 。 下 面 是 一 些 根据 图 3-6 中 的 运算 符 从 工 和 构造 得 到 的 新 语言 ; 

1) LUD 是 字母 和 数位 的 集合 一 一 严格 地 讲 , 这 个 语言 包含 62 个 长 度 为 1 的 串 , 每 个 串 是 一 
个 字母 或 一 个 数位 。 

.2) LD 是 包含 520 个 长 度 为 2 的 串 的 集合 , 每 个 串 都 是 一 个 字母 跟 一 个 数位 。 

3) Lt 是 所 有 由 四 个 字母 构成 的 串 的 集合 。 

4) L* 是 所 有 由 字母 构成 的 串 的 集合 ,包括 空 串 e。 

5) L(LUD)* 是 所 有 以 字母 开头 的 , 由 字母 和 数位 组 成 的 串 的 集合 。 

6) D+ 是 由 一 个 或 多 个 数位 构成 的 串 的 集合 。 





El 

3.3.3 正则 表达 式 

假设 我 们 要 描述 C 语言 的 所 有 合法 标识 符 的 集合 。 它 差不多 就 是 例 3. 3 的 第 5 项 所 定义 的 
语言 , 唯一 的 不 同 是 C 的 标识 符 中 可 以 包括 下 划 线 。 

在 例 3.3 中 , 我 们 可 以 首先 给 出 字母 和 数位 集合 的 名 字 , 然后 使 用 并 、 连 接 和 闭 包 这 些 运 算 
符 来 描述 标识 符 。 这 种 处 理 方法 非常 有 用 。 因 此 , 人们 常常 使 用 一 种 称 为 正则 表达 式 的 表示 方 
法 来 描述 语言 。 正 则 表达 式 可 以 描述 所 有 通过 对 某 个 字母 表 上 的 符号 应 用 这 些 运算 符 而 得 到 的 
语言 。 在 这 种 表示 法 中 , MRE letter _ 来 表示 任 一 字母 或 下 划 线 , 用 digit _ 来 表示 数位 , 那 
么 可 以 使 用 如 下 的 正则 表达 式 来 描述 对 应 于 C 语言 标识 符 的 语言 : 

letter _( letter _| digit) * 

上 式 中 的 竖 线 表示 并 运算 , 括号 用 于 把 子 表达 式 组 合 在 一 起 , 星 号 表示 “ 零 个 或 多 个 ” 插 号 中 表 
达 式 的 连接 , 将 lener _ 和 表达 式 的 其 余部 分 并 列表 示 连 接 运算 。 


了 
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正则 表达 式 可 以 由 较 小 的 正则 表达 式 按照 如 下 规则 递归 地 构建 。 每 个 正则 表达 式 > 表示 一 
个 语言 上 (r) , 这 个 语言 也 是 根据 r 的 子 表达 式 所 表示 的 语言 递归 地 定义 的 。 下 面 的 规则 定义 了 某 
个 字母 表 吕 上 的 正则 表达 式 以 及 这 些 表达 式 所 表示 的 语言 。 

归纳 基础 : 如 下 两 个 规则 构成 了 归纳 基础 
1) e 是 一 个 正则 表达 式 , Le) = lel, 即 该 语言 只 包含 空 串 。 
2) 如 果 a 是 吕 上 的 一 个 符号 , 那么 a 是 一 个 正则 表达 式 , 并 且 Lla) = fo}, RBH, 这 个 语 
言 仅 包 含 一 个 长 度 为 1 的 符号 串 a。 请 注意 , 根据 惯例 , 我 们 通常 用 斜体 表示 符号 , MERRE 
们 所 对 应 的 正则 表达 式 。S 

归纳 步骤 : 由 小 的 正则 表达 式 构 造 较 大 的 正则 表达 式 的 步骤 有 四 个 部 分 。 假 定 r 和 s 都 是 正 
则 表达 式 , 分 别 表示 语言 Ltr) 和 L(s), 那么: : 

1) (r) | (s) 是 一 个 正则 表达 式 , 表示 语言 L(r) UL(s)。 

2) (r) (s) 是 一 个 正则 表达 式 , 表示 语言 L(r)L(s)。 

3)(r) * 是 一 个 正则 表达 式 , 表示 语言 (L(r))*。 

4) (r) 是 一 个 正则 表达 式 , 表示 诺言 L(r)。 最 后 这 个 规则 是 说 在 表达 式 的 两 边 加 上 括号 并 
不 影响 表达 式 所 表示 的 语言 。 i 

按照 上 面 的 定义 , 正则 表达 式 经 常会 包含 一 些 不 必要 的 括号 。 如 果 我 们 采用 如 下 的 约定 , 就 
可 以 丢掉 一 些 括号 : 

1) 一 元 运算 符 * 具有 最 高 的 优先 级 ,并且 是 左 结合 的 。 

2) 连接 具有 次 高 的 优先 级 , 它 也 是 左 结合 的 。 

3) 1 的 优先 级 最 低 , 并 且 也 是 左 结 合 的 。 

例如 , 我 们 可 以 根据 这 个 约定 将 (a)1((b)* (ce) ) 改 写 为 alb*c。 这 两 个 表达 式 都 表示 同样 
HERE, 其 中 的 元 素 要 么 是 单个 a, 要么 是 由 0 个 或 多 个 总 后 面 再 跟 - 一 个 < 组 成 的 串 。 








1) 正则 表达 式 alb 表示 语言 (a, b| 。 

2) 正则 表达 式 (alb) (alb) 表 示 语 言 |aa, ab, ba, bb), DEFAR 上 长 度 为 2 WHA AB 
的 集合 。 可 表示 同样 语言 的 另 一 个 正则 表达 式 是 aalablbalbb。 

3) 正则 表达 式 a* 表示 所 有 由 零 个 或 多 个 组 成 的 串 的 集合 , Ble, a, aa, aaa, |} o 

4) 正则 表达 式 (alb) ”表示 由 零 个 或 多 个 a 或 5 的 实例 构成 的 串 的 集合 , 即 由 a Ald ARH 
PARAS le, a, b, aa, ab, ba, bb,，aaa,，…|}。 另 一 个 表示 相同 语言 的 正则 表达 式 是 
(ab”)”。 

5) 正则 表达 式 ala*b 表示 语言 {a, b, ab, aab, aaah, =) ,也 就 是 串 a 和 以 六 结尾 的 零 个 或 
多 个 上 组 成 的 串 的 集合 。 | O 

可 以 用 一 个 正则 表达 式 定 义 的 语言 叫做 正则 集合 (regular set ) 。 如 果 两 个 正则 表达 式 Al s 
表示 同样 的 语言 , ME r 和 s 等 价 (equivalent)， 记 作 -=s。 例 如 ，(alb) = (bla)。 正 则 表达 式 遵 
守 一 些 代 数 定 律 , 每 个 定律 都 断言 两 个 具有 不 同形 式 的 表达 式 等 价 。 图 3-7 给 出 了 一 些 对 于 任意 
正则 表达 式 r、s 和 + 都 成 立 的 代数 定律 。 


O 然而 , 当 讨 论 ASCH 字符 集中 的 特定 字符 时 , 我 们 通常 将 使 用 电 传 字体 同时 表示 字符 和 它 的 正则 表达 式 。 
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定律 fH 
rls = slr | 是 可 以 交换 的 
r|(slt) = (r[s)\t 是 可 结合 的 
r(s|t) =rs|rt; (slt)r = sr|tr | 连接 对 | 是 可 分 配 的 | 
er=re=r < 是 连接 的 单位 元 
r” = (rle)* 闭 包 中 一 定 包含 ¢ 
rear DEEE 
图 3-7 正则 表达 式 的 代数 定律 


3.3.4 正则 定义 
为 方便 表示 , 我 们 可 能 希望 给 某 些 正则 表达 式 命名 , 并 在 之 后 的 正则 表达 式 中 像 使 用 符号 一 
FARES SE. MRS 是 基本 符号 的 集合 , 那么 一 个 正则 定义 (regular definition) 是 具有 如 下 
形式 的 定义 序列 : 
dir 


中 一 ry 


dir, 


其 中 

。 每 个 di 都 是 一 个 新 符号 ,它们 都 不 在 于 中 ,并且 各 不 相同 。 

e Ar BEER IU di , d, …, di_1| 上 的 正则 表达 式 。 

我 们 限制 每 个 r; 中 只 含有 台中 的 符号 和 在 它 之 前 定义 的 各 个 dj, 因此 避免 了 递归 定义 的 间 
题 , 并 且 我 们 可 以 为 每 个 r 构造 出 只 包含 台中 符号 的 正则 表达 式 。 我 们 可 以 首先 将 r,( 它 不 能 使 
用 di 之 外 的 任何 d) 中 的 di BHA r, 然后 再 将 r 中 的 di 和 dy BRA n 和 (替换 之 后 的 )m， 
依 此 类 推 。 最 后 , 我们 将 m 中 的 di(i=1, 2,…, n- DERA n 的 经 蔚 换 后 的 版 本 , 在 这 些 版 本 
中 都 只 包含 总 中 的 符号 。 

C 语言 的 标识 符 是 由 字母 、 数 字 和 下 划 线 组 成 的 串 。 下 面 是 C 标识 符 对 应 的 语言 的 一 





个 正则 定义 。 我 们 将 按照 惯例 用 斜体 字 来 表示 正则 定义 中 定义 的 符号 。 
letter, > A|B---|Z[ald |---[2]- 
digit 一 O|1|---|9 


id —  letter_( letter_| digit )* 




















口 
AR ( 整 型 或 浮 点 型 ) 无 符号 数 是 形 如 5280、0.01234、6.336E4 或 1.89E -4 的 串 。 下 
面 的 正则 定义 给 出 了 这 类 符号 串 的 精确 规约 : 
digit > 011|…|9 
digits — digit digit 
optionalFraction 一 . digits | € 
optionalEsponent + (E( +|- |e) digits) | € 
number — digits optionalFraction optionalEzponent 


在 这 个 定义 中 ,optionalFraction BARE, 要 么 是 小 数 点 后 再 跟 一 个 或 多 个 数位 。optiona- 
[Exponent WRAL BS, 就 是 字母 EE 后 跟随 一 个 可 选 的 + 号 或 -号 , 再 跟 上 一 个 或 多 个 数位 。 请 
注意 , 小 数 点 后 至 少 要 跟 一 个 数位 ,所 以 number 和 1. 不 匹配 , 但 和 1.0 匹配 。 回 
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3.3.5 正则 表达 式 的 扩展 

自从 Kleene 在 20 世纪 50 年 代 提 出 了 带 有 基本 运算 符 并 、 连 接 和 Kleene 闭 包 的 正则 表达 式 
之 后 , 已 经 出 现 了 很 多 种 针对 正则 表达 式 的 扩展 , 它们 被 用 来 增强 正则 表达 式 描 述 昌 模式 的 能 
力 。 在 这 里 , 我 们 介绍 的 一 些 最 早出 现在 像 Lex 这 样 的 Unis 实用 程序 中 的 扩展 表示 法 。 这 些 扩 
展 表 示 法 在 词法 分 析 器 的 规约 中 非常 有 用 。 本 章 的 参考 文献 中 包含 了 一 个 对 当今 仍 在 使 用 的 正 
则 表达 式 变 体 的 讨论 。 

1) 一 个 或 多 个 实例 。 单 目 后 缀 运算 符 + 表示 一 个 正则 表达 式 及 其 语言 的 正 闭 包 。 也 就 是 
说 , 如 果 r 是 一 个 正则 表达 式 , 那么 (>) + 就 表示 语言 (L(r) ) + 。 运 算 符 + 和 运算 符 * 具有 同样 的 
优先 级 和 结合 性 。 两 个 有 用 的 代数 定律 r* =r+le 和 r+ =rr* =r*r 说 明了 Kleene 闭 包 * 和 正 闭 
包 之 间 的 关系 。 

2) 零 个 或 一 个 实例 。 单 目 后 缀 运算 符 ? 的 意思 是 “ 零 个 或 一 个 出 现 "。 也 就 是 说 , r? 等 价 于 
rle, 换 句 话说 , LO?) = L(r) U jiel 。 运 算 符 ? 与 运算 符 + 和 运算 符 * 具有 同样 的 优先 级 和 结合 
性 。 

3) FRR AEWRE alale la, (其 中 a, 是 字母 表 中 的 各 个 符号 ) 可 以 缩写 为 
[ajay a] EREHE, Ya), a), o, a, 形成 一 个 逻辑 上 连续 的 序列 时 ， 比 如 连续 的 大 写字 
母 、 小 写字 母 或 数位 时 , 我 们 可 以 把 它们 表示 成 a/ -a,。 也 就 是 说 , 只 写 出 第 一 个 和 最 后 一 个 符 
号 , 中 间 用 连词 符 隔 开 。 因 此 , [abe] alble 的 缩写 , [a -2z] 是 albl…1z 的 缩写 。 

OR 根据 这 些 缩写 表示 法 , 我 们 可 以 将 例 3.5 中 的 正则 定义 改写 为 : 


letter. — [A-Za~z_] 
digit — [0-9] 
id —  letter_( letter_| digit )* 











例 3. 6 的 正则 定义 可 以 简化 为 : 
digit — [0-9] 
digits —  digit* 
number — digits (. digits)? (E (+-]? digits )? 口 

3.3.6 3.3 节 的 练习 

练习 3. 3. 1: 对 于 下 列 各 个 语言 , 查询 语言 使 用 手册 以 确定 : (i) 形 成 各 语言 的 输入 字母 表 的 
字符 集 分 别 是 什么 (不 包括 那些 只 能 出 现在 字符 串 或 注释 中 的 字符 )? (ii) 各 语言 的 数字 常量 的 
词法 形式 是 什么 ? (过 ) 各 语言 的 标识 符 的 词法 形式 是 什么 ? 

(1) C (2) C++ (3) C# (4) Fortran (5) Java (6) Lisp (7) SQL 

! 练习 3.3.2: 试 描述 下 列 正则 表达 式 定义 的 语言 : 

1) a(alb)*a 

2) ((ela)b* )* 

3) (alb)* aCalb) (alb) 

4) a* ba* ba* ba* 

!! 5) (aalbb) ((ablba) (aalbb) * (ab!ba) (aa! bb)* )* 

练习 3. 3.3: 试 说 明 在 一 个 长 度 为 n 的 字符 串 中 , 分 别 有 多 少 个 

1) 前 级 

2) JAB 

3) AMA 

14) FẸ 
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15) 子 序列 

练习 3. 3.4: 很 多 语言 都 是 大 小 写 敏 感 的 ( case sensitive), 因此 这 些 语言 的 关键 字 只 能 有 一 种 写 
法 , 描述 这 些 关 键 字 的 词素 的 正则 表达 式 就 很 简单 。 但 是 , 像 SQL 这 样 的 语言 是 大 小 写 不 敏感 的 
(case insensitive), 一 个 关键 字 既 可 以 大 写 , 也 可 以 小 写 , 还 可 以 大 小 写 混用 。 因 此 , SQL 中 的 关键 
字 SELECT WWE mk select, Select 或 sE1EcT。 请 描述 出 如 何 用 正则 表达 式 来 表示 大 小 写 不 
敏感 的 语言 中 的 关键 字 。 给 出 描述 SQL 语言 中 的 关键 字 “select” 的 表达 式 , 以 说 明 你 的 思想 。 

| 练习 3. 3.5: 试 写 出 下 列 语言 的 正则 定义 : 

1) 包含 5 个 元 音 的 所 有 小 写字 母 串 , 这 些 串 中 的 元 音 按 顺序 出 现 。 

2) 所 有 由 按 词典 递增 序 排列 的 小 写字 母 组 成 的 串 。 

3) 注释 ， 即 /* 和 */ 之 间 的 串 , 且 囊 中 没有 不 在 双 引 号 (" ) 中 的 */。 

114) 所 有 不 重复 的 数位 组 成 的 串 。 提 示 : 首先 尝试 解决 只 含有 少量 数位 (比如 10, 1, 21) 
的 数位 串 。 

115) 所 有 最 多 只 有 一 个 重复 数位 的 串 。 

116) 所 有 由 偶数 个 a 和 奇数 个 5 构成 的 串 。 

7) 以 非 正式 方式 表示 的 国际 象棋 的 步 法 的 集合 , Up -kt 或 kbp x qn。 

118) 所 有 由 a Ab AMARA PB abb 的 串 。 

9) 所 有 由 a 和 组 成 县 不 含 子 序列 abb HE, 

练习 3. 3. 6: 为 下 列 的 字符 集合 写 出 对 应 的 字符 类 。 

1) 英文 字母 的 前 10 个 字母 (从 a ~ 刀 , 包括 大 写 和 小 写 。 

2) 所 有 小 写 的 辅音 字母 的 集合 。 

3) 十 六 进 制 中 的 “数位 ”( 对 大 于 9 的 数位 ， 自己 决 定 大 写 或 小 写 )。 

4) 可 以 出 现在 一 个 合法 的 英语 句子 后 面 的 字符 集 ( 比如 感叹 号 ) 。 

从 下 面 开始 直到 练习 3. 3. 10( 含 ) 讨 论 了 来 自 Lex 的 正则 表达 式 的 扩展 表示 方法 (我 们 将 在 
3.5 节 中 讨论 这 个 词法 分 析 器 生成 工具 )。 这 些 扩 展 表示 方法 在 图 3-8 中 列 出 。 






































表达 式 匹配 例子 | 
c 单个 非 运算 符 字 符 c a 
\c 字符 c 的 字面 值 \x 
"s" 串 3 的 字面 值 Meet 
除 换行 符 以 外 的 任何 字符 a.*b 
一 行 的 开始 “abc 
$ 行 的 结尾 abc$ 
[s] FAR s 中 的 任何 一 个 字符 [abc] 
[s] 不 在 串 s 中 的 任何 一 个 字符 [abc] 
rx 和 匹配 的 零 个 或 多 个 串 连 接 成 的 串 。 | ar 
7 十 和 匹配 的 一 个 或 多 个 串 连 接 成 的 串 。 | at 
r? 零 个 或 一 个 了 a? 
r{m,n} komi, RE nA HEH a{1,5} 
TIT2 站 后 加 上 上 7 ab 
ri | 72 Tl 或 72 alb 
(r) 与 了 相同 (alb) 
r1/T2 后 面 跟 有 ?2 时 的 7 abc/123 


图 3-8 Lex 的 正则 表达 式 
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练习 3.3. 7: 请 注意 这 些 正则 表达 式 中 的 下 列 字符 ( 称 为 运算 符 字符 ) 都 具有 特殊 的 含义 : 
Nts Tes Boe Te 

如 果 想 要 使 得 这 些 特殊 字符 在 一 个 捉 中 表示 它们 自身 , 就 必须 取消 它们 的 特殊 含义 。 我 们 
将 它们 放 在 一 个 长 度 大 于 等 于 1 且 加 上 双 引 号 的 串 中 就 可 以 取消 特殊 含义 。 例 如 , 正则 表达 式 
“sa” MFR s 匹配 。 我 们 也 可 以 在 一 个 运算 符 字符 前 加 一 个 反 斜 线 ， 得 到 这 个 字符 的 字面 
含义 。 那 么 , 正则 表达 式 \* \* 也 和 和 串 ** 匹配 。 请 写 出 一 个 和 字符 串 "\ 匹 配 的 正则 表达 式 。 

练习 3. 3.8: 在 Lex 中, 补 集 字符 类 (complemented character class) 代表 该 字符 类 中 列 出 的 字 
符 之 外 的 所 有 字符 。 我 们 将 ` 放 在 开头 来 表示 一 个 补 集 字 符 类 。 除 非 ` 在 该 字符 类 内 列 出 ,否则 这 
个 字符 不 在 被 取 补 的 字符 类 中 。 因 此 ,[ 人 -za -zj 匹配 所 有 不 是 大 小 写字 母 的 字符 ，[“\] 匹 
MR 以 及 换行 符 , 因为 它 不 在 任何 字符 类 中 ) 之 外 的 任何 字符 。 试 证 明 : 对 于 每 个 带 有 补 集 字 
符 类 的 正则 表达 式 , 都 存在 一 个 等 价 的 不 含 补 集 字 符 类 的 正则 表达 式 。 

! 练习 3. 3. 9: 正则 表达 式 rim, n| AB Ym Bn KEHRA. PM, all, 5| 和 
由 1~5 个 a 组 成 的 串 匹 配 。 试 证 明 : 对 于 每 一 个 包含 这 种 形式 的 重复 运算 符 的 正则 表达 式 , 都 
存在 一 个 等 价 的 不 包含 重复 运算 符 的 正则 表达 式 。 

! 练习 3. 3. 10 : 运算 符 “ 匹 配 一 行 的 最 左 端 , $ 匹 配 一 行 的 最 右 端 。 运 算 符 也 被 用 作 补 集 字符 
类 的 首 字 符 , 但 是 通过 上 下 文 总 是 能 够 确定 它 的 含义 。 例 如 ，“[ “aeiou] *$ 匹 配 任何 一 个 不 包 
含 小 写 元 音字 符 的 行 。 

1) 你 怎样 判断 “到 底 表示 哪 一 个 意思 ? 

2) 是 否 总 是 能 够 将 -一 个 包括 "和 $ 运 算 符 的 正则 表达 式 蔡 换 为 一 个 等 价 的 不 包含 这 些 运算 符 
的 正则 表达 式 ? 

| 练习 3. 3. 11; UNIX 的 shell 命令 sh 在 文件 名 表达 式 中 使 用 图 3.9 中 的 运算 符 来 描述 文件 名 
的 集合 。 例 如 , 文件 名 表达 式 .*.o 和 所 有 以 .o 结束 的 文件 名 匹配 ; sort1.? 和 所 有 形 如 











sort1.c 的 文件 名 匹配 , 其 中 < 可 以 是 任何 字符 。 试 问 如 何 使 用 只 包含 并 、 连 接 和 闭 包 运算 符 的 
正则 表达 式 来 表示 sh 文件 名 表达 式 ? 

表达 式 匹配 例子 

‘3! [as mama |V 

\e 字符 c 的 字面 什 V 

* 任何 串 *.0 

? 任何 字符 sortl.? 

[s] s 中 的 确 任何 字符 | sorti. [cso] | 











图 3-9 shell 命令 sh 使 用 的 文件 名 表达 式 


1 练习 3. 3. 12 : SQL 语言 支持 一 种 不 成 熟 的 模式 描述 方式 ,其 中 有 两 个 具有 特殊 含义 的 字 
符 ; 下 划 线 ( _ ) 表 示 任 意 一 个 字符 ; 百 分 号 多 表示 包含 0 个 或 多 个 字符 的 串 。 此 外 , 程序 员 还 可 
以 将 任意 一 个 字符 (比如 e) 定 义 为 转 义 字 符 。 那 么 ,在 _、 旬 或 者 另 一 个 e。 之 前 加 上 一 个 e, 就 使 得 
这 个 字符 只 表示 它 的 字面 值 。 假 设 我 们 已 经 知道 哪个 字符 是 转 义 字符 , 说 明 如 何 将 任意 SQL 模 
式 表示 为 一 个 正则 表达 式 。 


3.4 词法 单元 的 识别 


上 一 节 介绍 了 如 何 使 用 正则 表达 式 来 表示 一 个 模式 。 现 在 ， 我 们 必须 学 习 如 何 根据 各 个 需 
要 识别 的 词法 单元 的 模式 来 构造 出 一 段 代码 。 这 段 代 码 能 够 检查 输入 字符 串 ,并 在 输入 的 前 级 
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中 找 出 一 个 和 某 个 模式 匹配 的 词素 。 我 们 的 讨论 将 围绕 下 面 的 例子 展开 。 
AREI 图 3-10 的 文法 片段 描述 了 分 支 语 句 和 条 件 表达 式 的 一 种 简单 形式 。 这 个 语法 和 Pascal 
语言 的 语法 类 似 , 它 的 then 关键 字 显 式 地 出 现在 条 件 表达 式 的 后 面 。 对 于 relop, 我 们 使 用 Pas- 
cal 或 SQL 语言 中 的 比较 运算 符 , 其 中 = 表示 “相等 "，< > 表示 “不 相等 "， 因 为 它们 呈现 了 一 种 
有 意思 的 词素 结 构 。 

在 考虑 词法 分 析 器 时 , 文法 的 终结 符号 , 包括 if, then, else, relop, id 及 number, 都 是 词法 
单元 的 名 字 。 这 些 词法 单元 的 模式 使 用 图 3-11 中 的 正则 定义 来 描述 。 其 中 id 和 number 的 模式 和 
我 们 之 前 在 例 3.7 中 看 到 的 模式 类 似 。 


























digit — [0-9] 
digits — digitt 
stmt — if expr then stmt number — digits (. digits)? ( E [+-]? digits )? 
| if expr then stmt else stmt letter —  [A-Za-z] 
| e id — letter ( letter | digit )* 
expr — term relop term if => if 
| term then = then 
term =œ id else — else 
| number relop > <|>|<= [>= |=] <> 
图 3-10 分支 语句 的 文法 图 3-11 例 3.8 中 词法 单元 的 模式 


对 这 个 语音 ,词法 分 析 器 将 识别 关键 字 if, then, else 以 及 和 relop 、 id 和 num 的 模式 匹配 的 词 
素 。 为 了 简化 问题 ， 我们 做 出 如 下 的 常见 假设 : 关键 字 也 是 保留 字 。 也 就 是 说 , 它们 不 是 标识 
FF, 虽然 它们 的 词素 和 标识 符 的 模式 匹配 。 

此 外 , 我 们 还 让 词法 分 析 器 负责 消除 空白 符 , 方法 是 让 它 识别 如 下 定义 的 “词法 单元 ”ws。 

ws 一 ( blank | tab | newline )+ 

XE, blank, tab 及 newline 是 用 于 表示 具有 同样 名 字 的 ASCI 字符 的 抽象 符号 。 词 法 单元 
ws 同 其 他 的 词法 单元 的 不 同 之 处 在 于 : 当 我 们 识别 到 ws 时 , 我 们 并 不 将 它 返回 给 语法 分 析 器 ， 
而 是 从 这 个 空白 之 后 的 字符 开始 继续 进行 词法 分 析 。 返 回 给 语法 分 析 器 的 是 下 一 个 词法 单元 。 

图 3-12 总 结 了 词法 分 析 器 的 目标 。 对 于 各 个 词素 或 词素 的 集合 , 该 表 显 示 了 应 该 将 哪个 词 
法 单元 名 返回 给 语法 分 析 器 , 以 及 按照 3.1.3 节 中 的 介绍 , 应 该 返回 什么 属性 值 。 请 注意 , 对 于 

















其 中 的 6 个 关系 运算 符 , 符号 常量 LT、LE 等 被 当 作 属性 值 返回 , 其 目的 是 指明 我 们 发 现 的 是 词 
法 单元 relop 的 哪个 实例 。 找 到 的 运算 符 将 影响 编译 器 输出 的 代码 。 E 
词素 | 词法 单元 名 字 属性 值 
Any ws 一 = 
if if 、 - 
then then E 
else else 一 
Any id id 指向 符号 表 条 目的 指针 
Any number number 指向 符号 表 条 目的 指针 
< relop LT 
<= relop LE 
= relop EQ 
<> relop NE 
> relop GT 
>= relop GE 














图 3-12 词法 单元 ,它们 的 模式 以 及 属性 值 
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3.4.1 状态 转换 图 

作为 构造 词法 分 析 器 的 一 个 中 间 步 骤 , 我 们 首先 将 模式 转换 成 具有 特定 风格 的 流 图 ， 称 为 
“状态 转换 图 ”。 在 本 节 中 , 我 们 用 手工 方式 将 正则 表达 式 表 示 的 模式 转化 为 状态 转换 图 , 在 3.6 
节 中 , 我 们 将 看 到 可 以 使 用 自动 化 的 方法 根据 一 组 正则 表达 式 集 合 构造 出 状态 转换 图 。 

状态 转换 图 (transition diagram ) 有 一 组 被 称 为 “状态 ”(state ) 的 结 点 或 圆圈 。 词 法 分 析 器 在 扫 
摘 输入 串 的 过 程 中 寻找 和 某 个 模式 匹配 的 词素 , 而 转换 图 中 的 每 个 状态 代表 一 个 可 能 在 这 个 过 
程 中 出 现 的 人 情况。 我们 可 以 将 一 个 状态 看 作 是 对 我 们 已 经 看 到 的 位 于 lexemeBegin 指针 和 forward 
指针 之 间 的 字符 的 总 结 , 它 包 含 了 我 们 在 进行 词法 分 析 时 需要 的 全 部 信息 。 

状态 图 中 的 边 (edge) 从 图 的 一 个 状态 指向 另 一 个 状态 。 每 条 边 的 标号 包含 了 一 个 或 多 
个 符号 。 如 果 我 们 处 于 某 个 状态 s, 并 且 下 一 个 输入 符号 是 a, 我 们 就 会 寻找 一 条 从 s BH 
且 标 号 为 a 的 边 ( 该 边 的 标号 中 可 能 还 包括 其 他 符号 ) 。 如 果 我 们 找到 了 这 样 的 一 条 边 , 就 
4% forward 指针 前 移 , 并 进入 状态 转换 图 中 该 边 所 指 的 状态 。 我 们 假设 所 有 状态 转换 图 都 是 
确定 的 ,这 意味 着 对 于 任何 一 个 给 定 的 状态 和 任何 一 个 给 定 的 符号 , 最 多 只 有 一 条 从 该 状 
态 离开 的 边 的 标号 包含 该 符号 。 从 3.5 节 开 始 , 我 们 将 放松 对 确定 性 的 要 求 , 令 词法 分 析 
器 的 设计 者 更 加 容易 完成 任务 , 但 同时 提高 了 对 实现 者 的 技巧 要 求 。 一 些 关 于 状态 转换 图 
的 重要 约定 如 下 : 

1) 某 些 状态 称 为 接受 状态 或 最 终 状态 。 这 些 状态 表明 已 经 找到 了 一 个 词素 , 虽然 实际 的 词 
素 可 能 并 不 包括 lexemeBegin 指针 和 forward 指针 之 间 的 所 有 字符 。 我 们 用 双 层 的 圈 来 表示 一 个 接 
SORA, 并 且 如 果 该 状态 要 执行 一 个 动作 的 话 一 一 通常 是 向 语法 分 析 器 返回 一 个 词法 单元 和 相 
关 属 性 值 一 一 我 们 将 把 这 个 动作 附加 到 该 接受 状态 上 。 

2) A>, WR EB forward 回 退 一 个 位 置 ( 即 相 应 的 词素 并 不 包含 那个 在 最 后 一 步 使 
我 们 到 达 接 受 状态 的 符号 ), 那么 我 们 将 在 该 接受 状态 的 附近 加 上 一 个 * 。 我 们 的 例子 都 不 
需要 将 forward 指针 回 退 多 个 位 置 , 但 万 一 出 现 这 种 情况 , 我 们 将 为 接受 状态 附加 相应 数目 

3) 有 一 个 状态 被 指定 为 开始 状态 , 也 称 初始 状态 , 该 状态 由 一 条 没有 出 发 结 点 的 、 标 号 为 
“start” 的 边 指明 。 在 读 和 人 任何 输入 符号 之 前 , 状态 转换 图 总 是 位 于 它 的 开始 状态 。 
3-13 给 出 了 能 够 识别 所 有 与 词法 单元 relop 匹配 的 词素 的 状态 转换 图 。 我 们 从 初始 
状态 0 开始 。 如 果 我 们 看 到 的 第 一 个 输入 符号 是 <, 那么 在 所 有 与 relop 模式 匹配 的 词素 中 , 我 
们 只 能 选择 < 、<> 或 <= 。 因 此 我 们 进入 状态 1 并 查看 下 一 个 字符 。 如 果 这 个 字符 是 =, RM 
识别 出 词素 <=, 进入 状态 2 并 返回 属性 值 为 LE 的 relop 词法 单元 。 其 中 的 符号 常量 LE 代表 了 
这 个 具体 的 比较 运算 符 。 如 果 在 状态 1, 下 一 个 字符 是 > , 那么 我 们 就 会 得 到 词素 <> , 从 而 进入 
状态 3 并 返回 一 个 词法 单元 , 表明 已 经 找到 一 个 不 等 运算 符 。 而 对 于 其 他 字符 , 识别 得 到 的 词素 
是 <, 我 们 进入 状态 4 并 向 语法 分 析 器 返回 这 个 信息 。 请 注意 ,状态 4 有 一 个 * 号 , 说 明 我 们 必 
须 将 输入 回 退 一 个 位 置 。 

另 一 方面 , 如果 在 状态 0 时 我 们 看 到 的 第 一 个 字符 是 =, 那么 这 个 字符 必定 是 要 识别 的 词 
素 。 我 们 立即 从 状态 5 返回 这 个 信息 。 其 余 的 可 能 性 是 第 一 个 字符 为 > 的 情况 。 那 么 我 们 应 该 
进入 状态 6， 并 根据 下 一 字符 确定 词素 是 >= (如果 我 们 看 到 下 一 个 字符 为 = ) 还 是 > (对 于 任何 
其 他 字符 ) 。 注 意 , 如 果 在 状态 0 时 我 们 看 到 的 是 不 同 于 < 、= 或 > 的 字符 , 我 们 就 不 可 能 看 到 
一 个 relop 的 词素 , 因此 这 个 状态 转换 图 将 不 会 被 使 用 。 | 口 








词法 分 析 83 











Start < = 
0 (1) : ~©) return( relop LE) 


Se 
全) return( relop, NE) 
= other j 
6 return( relop, LT) 
return( relop EQ) 


z, = 
一 一 铭 return( relop, GE) 


return( relop, GT) 


图 3-13 ”词法 单元 relop 的 状态 转换 图 


3.4.2 保留 字 和 标识 符 的 识别 

识别 关键 字 及 标识 符 时 有 一 个 问题 要 解决 。 通 常 , 像 if 或 then 这 样 的 关键 字 是 被 保留 的 
(在 我 们 正在 使 用 的 例子 中 就 是 如 此 ), 因此 虽然 它们 看 起 来 很 像 标 识 符 , 但 它们 不 是 标识 符 。 
因此 , 尽管 我 们 通常 使 用 如 图 3-14 所 示 的 状态 转换 图 来 寻找 标识 符 的 词素 , 但 这 个 图 也 可 以 识 
别 出 连续 使 用 的 例子 中 的 关键 字 if, then 及 else, 


Jetter or digit 


n 
start letter T other i 
=(9 ) = return (getToken(), installID ()) 


3-14 id 和 关键 字 的 状态 转换 图 


我 们 可 以 使 用 两 种 方法 来 处 理 那 些 看 起 来 很 像 标识 符 的 保留 字 : 
1) 初始 化 时 就 将 各 个 保留 字 填 人 符号 表 中 。 符 号 表 条 目的 某 个 字段 会 指明 这 些 串 并 不 是 普 
通 的 标识 符 , 并 指出 它们 所 代表 的 词法 单元 。 我 们 已 经 假设 图 3-14 中 使 用 了 这 种 方法 。 当 我 们 
找到 一 个 标识 符 时 ,如 果 该 标识 符 尚 未 出 现在 符号 表 中 ,就 会 调用 install1D 将 此 标识 符 放 人 符号 
表 中 , 并 返回 一 个 指针 ,指向 这 个 刚 找到 的 词素 所 对 应 的 符号 表 条 目 。 当 然 , 任何 在 词法 分 析 时 
不 在 符号 表 中 的 标识 符 都 不 可 能 是 一 个 保留 字 , 因此 它 的 词法 单元 是 id。 函数 getToken 查看 对 应 
于 刚 找到 的 词素 的 符号 表 条 目 , 并 根据 符号 表 中 的 信息 返回 该 词素 所 代表 的 词法 单元 名 一 一 要 
Afe id, 要 么 是 一 个 在 初始 化 时 就 被 加 入 到 符号 表 中 的 关键 字 词 法 单元 。 
2) 为 每 个 关键 字 建 立 单独 的 状态 转换 图 。 图 3-15 是 关键 字 then 的 一 个 例子 。 请 注意 , 这 样 
的 状态 转换 图 包含 的 状态 表示 看 到 该 关键 字 的 各 个 后 续 字 母后 的 情况 , 最 后 是 一 个 “ 非 字母 或 数 
字 ” 的 测试 , 也 就 是 检查 后 面 是 否 为 某 个 不 可 能 成 为 标识 符 一 部 分 的 字符 。 有 必要 检查 该 标识 符 
是 否 结束 ,否则 在 磁 到 词素 像 thenextvalue 这 样 以 then HAAN id 词法 单元 时 , 我 们 可 能 
会 错误 地 返回 词法 单元 chen。 如 果 采 用 这 个 方法 , 我 们 必须 设 定 词法 单元 之 间 的 优先 级 , 使 得 
当 一 个 词素 同时 匹配 id 的 模式 和 关键 字 的 模式 时 ,优先 识别 保留 字 词 法 单元 , 而 不 是 i 词法 单 
元 。 我 们 并 没有 在 例子 中 使 用 这 个 方法 , 这 也 是 我 们 没有 对 图 3-15 中 的 状态 进行 编号 的 原因 。 
start t h e n nonlet/di * 
Tooo 0 + -0™ ©) 


图 3-15 ”假想 的 关键 字 then 的 状态 转换 图 
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3.4.3 完成 我 们 的 例子 

我 们 在 图 3-14 中 看 到 , id 的 状态 转换 图 有 一 个 简单 的 结构 。 由 状态 9 开始 , 它 检查 被 识别 
的 词素 是 否 以 一 个 字母 开头 , 如 果 是 的 话 进 入 状态 10。 只 要 接 下 来 的 输入 包含 字母 或 数位 , 我 们 
就 一 直 停 留 在 状态 10。 当 我 们 第 一 次 过 到 不 是 字母 或 数位 的 其 他 任何 字符 时 , 便 转 人 状态 11 并 
接受 刚刚 找到 的 词素 。 因 为 最 后 一 个 字符 并 不 是 标识 符 的 一 部 分 , 我 们 必须 将 输入 回 退 一 个 位 
置 , 并且 如 3. 4. 2 节 所 讨论 的 那样 ,我们 将 已 经 找到 的 标识 符 加 入 到 符号 表 中 ,并 判断 我 们 得 到 
的 究竟 是 一 个 关键 字 还 是 一 个 真正 的 标识 符 。 

图 3-16 显示 了 词法 单元 number 的 状态 转换 图 , 它 是 我 们 至 今 为 止 看 到 的 最 复杂 的 状态 转 
换 图 。 从 状态 12 开始 , 如 果 我 们 看 到 一 个 数位 ,就 转 入 状态 13 。 在 该 状态 , 我 们 可 以 读 入 任意 
数量 的 其 他 数位 。 然 而 ,如果 我 们 看 到 了 一 个 不 是 数位 、 不 是 小 数 点 , AEE 的 其 他 字符 , 就 
得 到 了 一 个 整数 形式 的 数字 , 如 123 。 这 种 情形 在 进入 状态 20 时 进行 处 理 , 我 们 在 该 状态 返回 
词法 单元 number 以 及 一 个 指向 常量 表 条 目的 指针 , 刚刚 找到 的 词素 便 放 在 这 个 常量 表 条 目 中 。 
这 些 机 制 并 没有 在 这 个 转换 图 中 显示 出 来 , 但 它们 和 我 们 处 理 标识 符 的 方法 相似 。 





digit digit : digit 
start Leith) ` aks) E -BO O) * 








digit 
others, * other 


图 3-16 无 符号 数字 的 状态 转换 图 


如 果 我 们 在 状态 13 看 到 的 是 一 个 小 数 点 , 那么 我 们 就 看 到 一 个 “可 选 的 小 数 部 分 ”。 于 是 ， 
进入 状态 14, 并 寻找 一 个 或 多 个 更 多 的 数位 , 状态 15 就 被 用 于 此 目的 。 如 果 我 们 看 到 一 个 EE, 那 
么 我 们 就 看 到 了 一 个 “可 选 的 指数 部 分 ”, 它 的 识别 任务 由 状态 16 ~ 19 完成 。 如 果 我 们 在 状态 15 
看 到 的 是 不 同 于 EB 和 数位 的 其 他 字符 , 那么 我 们 就 到 达 了 小 数 部 分 的 结尾 , 这 个 数字 没有 指数 部 
分 , 我 们 将 通过 状态 21 返回 刚刚 找到 的 词素 。 

最 后 一 个 状态 转换 图 显示 在 图 3-17 中 , 它 用 于 识别 空白 符 。 在 该 图 中 , 我 们 寻找 一 个 或 多 
个 空白 字符 , 在 图 中 用 delim 表示 。 典 型 的 空白 字符 有 空格 、 制 表 符 、 换 行 符 ,， 有 可 能 包括 那些 
根据 语言 设计 不 可 能 出 现在 任何 词法 单元 中 的 字符 。 

注意 , 我 们 在 状态 24 中 找到 了 一 个 连续 的 空白 字符 组 delim 


成 的 块 , 且 后 面 还 跟随 一 个 非 空 白字 符 。 我 们 将 输入 回 退 san ja CO omer A> 
到 这 个 非 空白 符 的 开头 ,但 我 们 并 不 向 语法 分 析 器 返回 任 oe) 
MARET ME, 我 们 必须 在 这 个 空 自 符 之 后 再 次 启动 MT 空 自 符 的 状态 转换 图 
词法 分 析 过 程 。 
3.4.4 基于 状态 转换 图 的 词法 分 析 器 的 体系 结构 

有 几 种 方法 可 以 根据 -组 状态 转换 图 构造 出 一 个 词法 分 析 器 。 不 管 整体 的 策略 是 什么 ,每 
个 状态 总 是 对 应 于 一 段 代码 。 我 们 可 以 想象 有 一 个 变量 state 保存 了 一 个 状态 转换 图 的 当前 状 
态 的 编号 。 有 一 个 switch 语句 根据 state 的 值 将 我 们 转 到 对 应 于 各 个 可 能 状态 的 相应 代码 段 ， 
我 们 可 以 在 那里 找到 该 状态 需要 执行 的 动作 。 一 个 状态 的 代码 本 身 常 常 也 是 一 条 switch 语句 或 
多 路 分 支 语句 。 这 个 语句 读 人 并 检查 下 一 个 输入 字符 , 由 此 确定 下 一 个 状态 。 
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eee, 在 图 3-18 中 ,我 们 可 以 看 到 getRelop( ) 方 法 的 一 个 概述 。 它 是 一 个 C++ 函数 , 其 
任务 是 模拟 图 3-13 中 的 状态 转换 图 ,并 返回 一 个 TOKEN 类 型 的 对 象 。 该 对 象 由 一 个 词法 单元 名 
(在 该 例 中 必定 是 velop) 和 一 个 属性 值 (在 该 例 中 是 6 个 比较 运算 符 之 一 的 编码 ) 组 成 。 函 数 
getRelop() 首先 创建 一 个 新 的 对 象 retToken， 并 将 该 对 象 的 第 一 个 分 量 初始 化 为 RELOP， 即 
词法 单元 relop 的 编码 。 

在 case 0 中 , 我 们 可 以 看 到 一 个 典型 的 状态 行为 。 函 数 nextChar( ) 从 输入 中 获取 下 一 个 
字符 ,并 将 它 赋 给 局 部 变量 。 然 后 我 们 检查 “是 否 为 我 们 期 望 找到 的 三 个 字符 ,并 在 每 种 情况 
下 根据 图 3-13 所 示 的 状态 转换 图 完成 状态 转换 。 例 如 ,如 果 下 一 输入 字符 是 =， 那么 就 转换 到 
状态 5。 

如 果 下 一 个 输入 字符 不 是 某 个 比较 运算 符 的 首 字 符 ,， getRelop( ) 就 会 调用 函数 fail()。 
函数 ftail( ) 的 具体 操作 依赖 于 词法 分 析 器 的 全 局 错误 恢复 策 咯 。 它 应 该 将 forward 指针 重 置 
为 1exemeBegin WE, 使 得 我 们 可 以 使 用 另 一 个 状态 转换 图 从 尚未 处 理 的 输入 部 分 的 真实 开始 
位 置 开 始 识别 。 然 后 , 它 还 需要 将 变量 state 的 值 改 为 另 一 状态 转换 图 的 初始 状态 , 该 转换 图 
将 寻找 另 一 个 词法 单元 。 在 另 一 种 情况 下 ,如 果 所 有 的 转换 图 都 已 经 用 过 , 则 fail ) 可 以 启动 
一 个 错误 纠正 步骤 , 按照 3. 1. 4 节 中 讨论 的 方法 来 纠正 输入 并 找到 一 个 词素 。 

在 图 3-18 F, 我 们 还 展示 了 状态 8 的 行为 。 由 于 状态 8 带 有 一 个 * 号 , 我 们 必须 将 输入 指针 
回 退 一 个 位 置 (也 就 是 把 c 放 回 输入 流 )。 该 任务 由 函数 retract( ) 完 成 。 因 为 状态 8 代表 了 对 
词素 > 的 识别 , 我 们 把 返回 对 象 中 的 第 二 个 分 量 设置 成 GT， 即 这 个 运算 符 的 编码 。 我 们 假设 这 
个 分 量 的 名 字 是 attribute。 G 











TOKEN getRelop() 
{ 


TOKEN retToken = new(RELOP) ; 
while(1) { /* repeat character processing until a return 
or failure occurs */ 
switch(state) { 
case 0: c = nextChar(); 


if ( c == ‘<' ) state = 1; 
else if ( c == ’=' ) state = 5; 
else if ( c == ‘>’ ) state = 6; 
else fail(); /* lexeme is not a-relop */ 
break; 
case 1: 


case 8: retract(); 
retToken.attribute = GT; 
return(retToken); 











图 3-18 relop 的 转换 图 的 概要 实现 


为 了 在 适当 的 地 方 模拟 适当 的 状态 转换 图 , 我 们 考虑 几 种 将 如 图 3-18 所 示 的 代码 集成 到 整 
个 词法 分 析 器 中 的 方法 。 

1) 我 们 可 以 让 词法 分 析 器 顺序 地 尝试 各 个 词法 单元 的 状态 转换 图 。 然 后 , 在 每 次 调用 例 
3. 10 中 的 函数 fail( ) 时 , CEE forward 指针 并 启动 下 一 个 状态 转换 图 。 这 个 方法 使 我 们 可 
以 像 图 3-15 中 所 建议 的 那样 ,为 各 个 关键 字 使 用 各 自 的 状态 转换 图 。 我 们 只 需要 在 使 用 ia 的 状 
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态 转换 图 之 前 使 用 这 些 关键 字 的 转换 图 ,就 可 以 使 得 关键 字 被 识别 为 保留 字 。 

2) 我 们 可 以 “并 行 地 ”运行 各 个 状态 转换 图 , 将 下 一 个 输入 字符 提供 给 所 有 的 状态 转换 图 ， 
并 使 得 每 个 状态 转换 图 作出 它 应 该 执行 的 转换 。 如 果 我 们 采用 这 个 策略 , 就 必须 谨慎 地 解决 如 
下 的 问题 : 一 个 状态 转换 图 已 经 找到 了 一 个 与 它 的 模式 相 匹 配 的 词素 , 但 另外 的 一 个 或 多 个 状态 
转换 图 仍然 可 以 继续 处 理 输 入 。 解 决 这 个 问题 的 常见 策略 是 取 最 长 的 和 某 个 模式 相 匹 配 的 输入 
前 缀 。 举 例 来 说 ,该 规则 让 我 们 识别 出 标识 符 thenext 而 不 是 关键 字 then, 识别 出 -> 而 不 是 - 。 

3) 有 一 个 更 好 的 方法 , 也 是 我 们 将 在 下 面 各 节 中 采用 的 方法 ， 就 是 将 所 有 的 状态 转换 图 合 
并 为 一 个 图 。 我 们 允许 合并 后 的 状态 转换 图 尽量 读 取 输入 , 直到 不 存在 下 一 个 状态 为 止 ; 然后 像 
上 面 的 2 中 讨论 的 那样 取 最 长 的 和 某 个 模式 匹配 的 最 长 词素 。 在 我 们 的 例子 中 , 进行 这 种 合并 很 
简单 , 因为 没有 两 个 词法 单元 以 相同 的 字符 开头 。 也 就 是 说 , 根据 第 一 个 字符 就 可 以 知道 我 们 正 
在 寻找 的 是 哪个 词法 单元 。 因 此 , 我 们 可 以 直接 将 状态 0、9、12 及 22 合并 成 一 个 开始 状态 , 并 
保持 其 他 转换 不 变 。 但 一 般 而 言 , 正如 我 们 不 久 将 看 到 的 那样 , 合并 几 个 词法 单元 的 状态 转换 图 
的 问题 会 更 加 复杂 。 
3.4.5 3.4 节 的 练习 

练习 3. 4. 1: 给 出 识别 练习 3.3.2 中 各 个 正则 表达 式 所 描述 的 语言 的 状态 转换 图 。 

练习 3. 4.2: 给 出 识别 练习 3. 3.5 中 各 个 正则 表达 式 所 描述 的 语言 的 状态 转换 图 。 

从 下 面 的 练习 开始 到 练习 3. 4. 12 介绍 了 Aho-Corasick 算法 。 该 算法 可 以 在 文本 串 中 识别 一 
组 关键 字 , 所 需 时 间 和 文本 长 度 以 及 所 有 关键 字 的 总 长 度 成 正比 。 该 算法 使 用 了 一 种 称 为 “trie” 
的 特殊 形式 的 状态 转换 图 。trie 是 一 个 树 型 结构 的 状态 转换 图 ， 从 一 个 结 点 到 它 的 各 个 子 结 点 的 
边 上 有 不 同 的 标号 。Trie 的 叶子 结 点 表示 识别 到 的 关键 字 。 | 

Knuth, Morris 和 Pratt 提出 了 一 种 在 文本 串 中 识别 单个 关键 字 bb, db, 的 算法 。 这 里 的 trie 
是 一 个 包含 了 从 0 ~n 共 n+1 个 状态 的 状态 转换 图 。 状 态 0 是 初始 状态 , 状态 n 表示 接受 , 也 就 
是 发 现 关键 字 的 情形 。 从 0 到 n -1 之 间 的 任意 一 个 状态 s HR, 存在 一 个 标号 为 5, ,1 的 到 达 状 
态 s+1 的 转换 。 例 如 , 关键 字 ababaa 的 tre WH: 

OO“ +-O“-+-O--+O-—-O--O 

为 了 快速 处 理 文本 串 并 在 这 些 串 中 搜索 一 个 关键 字 , 针对 关键 字 515，…b，, 以 及 该 关键 字 中 
的 位 置 (对 应 于 关键 字 的 trie PARAS s) EMAR BK f(s), 该 函数 的 计算 方法 如 图 3-19 所 示 。 

该 函数 的 目标 是 使 得 5615,…bn,) 是 最 长 的 既是 5, 6，…6, 的 真 前 级 又 是 bibb, 的 后 级 的 子 
串 。f(s) 之 所 以 重要 , 原因 在 于 如 果 我 们 试图 用 一 个 文本 串 匹 配 bbb 并且 我 们 已 经 匹配 了 
前 s 个 位 置 , 但 此 时 匹配 失败 (也 就 是 说 文本 串 的 下 一 个 位 置 并 不 是 5b, ,1)，, 那么 f(s) 就 是 可 能 
以 我 们 的 当前 位 置 为 结尾 的 文本 串 相 匹配 的 最 长 的 b16，…b， 的 前 级。 当然 , 文本 串 的 下 一 个 字 
FED by) ,1， 否则 仍然 有 问题 , 必须 考虑 一 个 更 短 的 前 级 , BN bae) o 

看 一 个 例子 , 根据 ababaa 构造 的 tie 的 失效 函数 是 : 

s [112|13|415 
FG) rei 
例如 , 状态 3 和 1 分 别 表示 前 级 aba 以 及 a。 因 为 a 是 最 长 的 既是 aba 的 真 前 缀 ,同时 也 是 aba 
的 后 缀 的 串 , 因此 (3) =1。 同 样 , 因为 最 长 的 既是 ab 的 真 前 缀 又 是 它 的 后 组 的 字符 串 是 空 串 ， 
因此 f(2) =0。 

练习 3. 4.3: 构 造 下 列 串 的 失效 函数 。 











a 




















= 
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1) abababaab 


2) aaaaaa 





3) abbaabb 
1)> t=O 
2) fl) = 0; 
3) for (s=1;s <n;s+t+){ 
4) while (t > 0 && bsi1!= bi) t = f(t); 
5) if (bs41 == ben) { 
6) t=t+1; 
7) f(st 1) it 
} 
8) else f(s +1) = 0; 
} 








图 3-19 计算 关键 字 bibo, MFR PRAISE 


| 练习 3. 4.4: 对 s 进行 归纳 , 证 明 图 3-19 的 算法 正确 地 计算 出 了 失效 函数 。 

(1 练习 3.4.5: 说 明 图 3-19 中 第 4 行 的 赋值 语句 :=f(i) 最 多 被 执行 n 次 。 进 而 说 明 整 个 算 
法 的 时 间 复 杂 度 是 0(n), 其 中 是 关键 字 的 长 度 。 

计算 得 到 关键 字 bibb, 的 失效 函数 之 后 , 我们 就 可 以 在 0(m) 时 间 内 扫描 字符 串 claz … 
a, 以 判断 该 关键 字 是 否 出 现在 其 中 。 图 3-20 中 所 展示 的 算法 使 关键 字 沿 着 被 匹配 字符 串 滑动 ， 
不 断 尝 试 将 关键 字 的 下 一 个 字符 与 被 匹配 字符 串 的 下 一 个 字符 匹配 , 逐步 推进 。 如 果 在 匹配 了 。 
个 字符 后 无 法 继续 匹配 ,那么 该 算法 将 关键 字 “ 向 右 滑 动 ”s -f(s) 个 位 置 , 也 就 是 认为 只 有 该 关 
键 字 的 前 f(s) 个 字符 和 被 匹配 字符 串 匹 配 。 

练习 3. 4. 6: 应 用 KMP 算法 判断 关键 字 ababaa 是 否 为 下 面 字符 串 的 子 串 : 

1) abababaab 

2) abababbaa 

1! 练习 3.4.7: 说 明 图 3-20 中 的 算法 可 以 正确 地 指出 输入 关键 字 是 否 为 一 个 给 定 字符 串 的 
FR, RE: 对 i 进行 归纳 。 说 明 对 于 所 有 的 i, 在 第 四 行 运行 后 * 的 值 是 那些 既是 a1a，…a; 的 后 
级 又 是 该 关键 字 的 前 缀 的 字符 串 中 最 长 字符 串 的 长 度 。 

















) s=0; 

) for(i=1;ig m;,i++4) { 

) while (s > 0 && ai! = bs41) $ = f(s); 
) 

) 





if (a; == bg41)'s = s+]; 
if (s == n) return “yes”; 


ak wn re 





6) return “no”; 





图 3-20 KMP 算法 在 0(m + mn) 时 间 内 检测 字符 串 a1a,…a 中 是 否 包含 单个 关键 字 b,b,--6, 


11 练习 3.4.8 :假设 已 经 计算 得 到 函数 1 且 它 的 值 存储 在 一 个 以 ;为 下 标的 数组 中 , 说 明 图 
3-20 中 算法 的 时 间 复 杂 度 为 0(m +n)。 

练习 3.4.9: Fibonacci 字符 囊 的 定义 如 下 : 

1) s, =b, 

2) 83 =ao 

3) 当天 >2 时 ，s =5,_15, 20 
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PiU, s3 = ab, sy = aba, ss =abaab, 

1) s, 的 长 度 是 多 少 ? 

2) 构造 se 的 失效 函数 。 

3) 构造 s7 的 失效 函数 。 

!11 4) 说 明 任何 s, 的 失效 浮 数 都 可 以 被 表示 为 ; f(1) =f(2) =0, 且 对 于 2 <j<ts,1, fO = 
j- lsi |, 其 中 上 是 使 得 ls41<j+1 的 最 大 的 整数 。 

115) 在 KMP 算法 中 ， 当 我 们 试图 确定 关键 字 5, 是否 出 现在 字符 串 s4 ,1 中 时 ,最 多 会 连续 
多 少 次 调用 失效 函数 ? 

Aho 和 Corasick 对 KMP 算法 进行 了 推广 , 使 它 可 以 在 一 个 文本 捉 中 识别 一 个 关键 字 集 合 中 
的 任何 关键 字 。 在 这 种 情况 下 , vie 是 一 棵 真正 的 树 ， 从 其 根 结 点 开始 就 会 出 现 分 支 。 如 果 一 个 
字符 串 是 某 个 关键 字 的 前 缀 (不 一 定 是 真 前 缀 ) ,那么 在 trie 中 就 有 一 个 和 该 字符 串 对 应 的 状态 。 
E bbr b -1 对 应 的 状态 是 串 515，…B4 对 应 的 状态 的 父 结 点 。 如 果 一 个 状态 对 应 于 菜 个 完整 的 
KEF, 那么 该 状态 就 是 接受 状态 。 例 如 , 图 3-21 显示 了 对 应 于 关键 字 he、she、 his 和 hers 
的 trie 树 。 











oO 一 oO 


| 








图 3-21 关键 字 he、she、his #l hers 的 trie 树 


通用 trie 树 的 失效 函数 的 定义 如 下 。 假 设 * RENT AEF AB bibb, 的 状态 ,那么 状态 f(s) 对 应 
于 最 长 的 、 既 是 串 Dy by +d, 的 后 缀 又 是 某 个 关键 字 的 前 缀 的 字符 串 。 例 如 , 图 3-21 中 trie 树 的 失 
效 函 数 为 : 











1]2]3]4l5]6]7]81T9) 
7 AEE 

| 练习 3. 4.10: 修改 图 3-19 中 的 算法 , 使 它 可 以 计算 通用 trie 树 的 失效 函数 。 提 示 : 主要 
的 不 同 在 于 , 在 图 3-19 的 第 4、5 行 上 , 我 们 不 能 简单 地 测试 5, ,1 和 4 ,| 是 否 相等 。 从 任何 一 个 
状态 出 发 , 都 可 能 存在 多 个 在 不 同 字 符 上 的 转换 。 比 如 在 图 3-21 中 , 存在 从 状态 1 出 发 、 分 别 在 
字符 e 和 i 上 的 两 个 转换 。 这 些 转 换 都 可 能 进入 代表 了 最 长 的 既是 后 缀 又 是 前 缀 的 字符 串 的 状 

练习 3. 4. 11: 为 下 面 的 关键 字 集 合 构造 tie 以 及 失效 函数 。 

1) aaa, abaaa 和 ababaaa, 

2) all, fall, fatal, llama 和 lame, 

3) pipe, pet, item, temper 和 perpetual, 


! 练习 3. 4. 12 :说 明 练 习 3. 4. 10 中 所 设计 的 算法 的 运行 时 间 和 所 有 关键 字 长 度 的 总 和 成 线 
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3.5 词法 分 析 器 生成 工具 Lex 


在 本 节 中 ， 我们 将 介 绍 一 个 名 为 Lex 的 工具 。 在 最 近 的 实现 中 它 也 称 为 lex。 它 支持 使 用 正 
则 表 这 式 来 描述 各 个 词法 单元 的 模式 ,由 此 给 出 一 个 词法 分 析 吕 的 规约 。Lex 工具 的 输入 表示 广 
法 称 为 Lex 语言 (Lex language), 而 工具 本 身 则 称 为 Lex 编译 器 (Lex compiler) 。 在 它 的 核心 部 分 ， 
Lex 编译 器 将 输入 的 模式 转换 成 一 个 状态 转换 图 , 并 生成 相应 的 实现 代码 , 并 存放 到 文件 
Lex. yy. c 中。 这些 代 码 模 拟 了 状态 转换 图 。 如 何 将 正则 表达 式 翻 译 为 状态 转换 图 是 下 一 节 讨 
论 的 主题 , 这 里 我 们 只 学 习 Lex 语言 。 
3.5.1 Lex 的 使 用 
Lex 的 使 用 方法 如 图 3222 所 示 。 首 先 , 用 Lex 语言 写 出 一 个 输入 文件 , 描述 将 要 生成 的 词法 
分 析 器 。 在 图 中 这 个 输入 文件 称 为 lex.1。 然 后 ,Lex 编译 器 将 lex.1 转换 成 C 语言 程序 , 存 
放 该 程序 的 文件 名 总 是 lex. yy .c。 最 后 , 文件 lex. yy. c 总 是 被 C 编译 器 编译 为 一 个 名 为 a. out 
的 文件 。C 编译 器 的 输出 就 是 一 个 读 取 输 入 字符 流 并 生成 词法 单元 流 的 可 运行 的 词法 分 析 器 。 
编译 后 的 C 程序 , 在 图 3-22 中 被 称 为 a. out, 通常 是 一 个 被 语法 分 析 器 调用 的 子 例 程 , 这 个 
子 例 程 返回 一 个 整数 值 , 即 可 能 出 现 的 某 个 词法 单元 名 的 编码 。 而 词法 单元 的 属性 值 , 不 管 它 是 
一 个 数字 编码 , 还 是 一 个 指向 符号 表 的 指针 ， 或 者 什么 都 没有 , 都 保存 在 全 局 变量 yylval FO, 
这 个 变量 由 词法 分 析 器 和 语法 分 析 器 共享 。 这 人 么 做 可 以 同时 返回 一 个 词法 单元 名 字 和 一 个 属 
性 值 。 














3.5.2 Lex 程序 的 结构 in Re = 
— Lex 程序 具有 如 下 形式 : BLO gg e e 
声明 部 分 - 

Yo Vo lex.yy.c 一 一 一 peor ~ a.out 
转换 规则 
an 输入 流 “ 一 一 ”aont [一 一 词法 单元 的 序列 




















声明 部 分 包括 变量 和 明示 常量 (manifest con- 
stant， 被 声明 的 表示 一 个 常数 的 标识 符 ， 如 一 个 词 
法 单元 的 名 字 ) 的 声明 和 3. 3. 4 节 中 描述 的 正则 定义 。 

Lex 程序 的 每 个 转换 规则 具有 如 下 形式 : 

模式 | 动作 | 

其 中 , 每 个 模式 是 一 个 正则 表达 式 , 它 可 以 使 用 声明 部 分 中 给 出 的 正则 定义 。 动 作 部 分 是 代码 片 
Bro 虽然 人 们 已 经 创建 了 很 多 能 使 用 其 他 语言 的 Lex 的 变 体 , 但 这 些 代码 片段 通常 是 用 C 语言 
写 的 。 | 
Lex 程序 的 第 三 个 部 分 包含 各 个 动作 需要 使 用 的 所 有 辅助 函数 。 还 有 一 种 方法 是 将 这 些 消 数 
单独 编译 , 并 与 词法 分 析 器 的 代码 一 起 装载 。 

由 Lex 创建 的 词法 分 析 器 和 语法 分 析 器 按照 如 下 方式 协同 工作 。 当 词法 分 析 器 被 语法 分 析 
器 调用 时 ,词法 分 析 器 开始 从 余下 的 输入 中 逐个 读 取 字 符 , 直到 它 发 现 了 最 长 的 与 某 个 模式 Pi 


图 3-22 用 Lex 创建 一 个 词法 分 析 器 





O ”顺便 说 一 下 , 在 yylval f lex.yy.c 中 出 现 的 yy 指 的 是 我 们 将 在 4.9 节 中 讨论 的 语法 分 析 器 生成 工具 yace, 它 
一 般 和 Lex 一 起 使 用 。 
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匹配 的 前 级 。 然 后 , 词法 分 析 器 执行 相关 的 动作 4;。 通 常 4; 会 将 控制 返回 给 语法 分 析 器 。 然 而 ， 
如 果 它 不 返回 控制 (比如 P; 描述 的 是 空白 符 或 注释 ), 那么 词法 分 析 器 就 继续 寻找 其 他 的 词素 ， 
直到 某 个 动作 将 控制 返回 给 语法 分 析 器 为 止 。 词 法 分 析 需 只 向 语法 分 析 器 返回 一 个 值 ， 即 词法 
单元 名 。 但 在 需要 时 可 以 利用 共享 的 整 型 变量 yylval 传递 有 关 这 个 词素 的 附加 信息 。 

图 3-23 是 一 个 Lex 程序 , 它 能 够 识别 图 3-12 中 的 各 个 词法 单元 ,并 返回 找到 的 词法 
单元 。 观 察 这 段 代 码 可 以 发 现 Lex 的 很 多 重要 特点 。 

我 们 在 声明 部 分 看 到 一 对 特殊 的 括号 : S 和 sj 。 出 现在 括号 内 的 所 有 内 容 都 被 直接 复制 到 
文件 lex. yy. c 中 。 它 们 不 会 被 当 作 正则 定义 处 理 。 我 们 一 般 将 明示 常量 的 定义 放置 在 该 括号 
A, 并 利用 C 语言 的 Haefine 语句 给 每 个 明示 常量 赋予 一 个 唯一 的 整数 编码 。 在 我 们 的 例子 中 ， 
我 们 在 一 个 注释 中 列 出 了 LT、IF 等 明示 常量 , 但 没有 显示 它们 被 赋予 哪些 特定 的 整数 .9 

在 声明 部 分 还 包含 一 个 正则 定义 的 序列 。 这 些 定义 使 用 了 3.3.5 节 中 描述 的 正则 表达 式 的 
扩展 表示 方法 。 那 些 将 在 后 面 的 定义 中 或 某 个 转换 规则 的 模式 中 使 用 的 正则 定义 用 花 括号 括 起 
来 。 例 如 ，delim 被 定义 为 表示 一 个 包含 了 空格 、 制 表 符 及 换行 符 的 字符 类 的 缩写 。 后 两 个 字符 
分 别 用 反 斜 线 再 跟 上 4 及 来 表示 。 这 个 表示 法 和 UNIX 命令 使 用 的 方法 相同 。 于 是 ,ws 通过 正 
则 表达 式 laeliml + 定义 为 一 个 或 多 个 分 隔 符 组 成 的 序列 。 

注意 , 在 id 和 number 的 定义 中 , 圆 括 号 是 用 于 分 组 的 元 符号 ,并 不 代表 圆 括号 自身 。 相 反 ， 
在 number 定义 中 的 互 代 表 其 自身 。 如 果 我 们 希望 Lex 的 某 个 元 符号 ( 比如 插 号 、+ 、* 或 ? 等 ) 
表示 其 自身 , 我 们 可 以 在 它们 前 面 加 上 一 个 反 斜 线 。 例 如 , 我 们 在 number 的 定义 中 看 到 的 \. 就 
表示 小 数 点 本 身 。 在 它 前 面 加 上 友和 斜 线 的 原因 是 ,和 在 UNIX 正则 表达 式 中 一 样 , 该 字符 在 Lex 
中 是 一 个 代表 “ 任 一 字符 ”的 元 符号 。 

在 辅助 函数 部 分 , 我 们 可 以 看 到 这 样 两 个 亢 数 : installID( ) 和 installNum( )。 和 和 位 
于 sj| … 人 中 的 声明 部 分 一 样 ， 出 现在 辅助 部 分 中 的 所 有 内 容 都 被 直接 复制 到 文件 lex.yy.c 中 。 
虽然 它们 位 于 转换 规则 部 分 之 后 , 但 这 些 函 数 可 以 在 规则 部 分 的 动作 定义 中 使 用 。 

最 后 ,让 我 们 看 -一 下 图 3-23 的 中 间 部 分 的 一 些 模式 和 规则 。 首 先 , 在 第 一 部 分 中 定义 的 标 
识 符 ws 有 一 个 相关 的 空 动作 。 如 果 我 们 发 现 了 一 个 空白 符 , 我 们 并 不 把 它 返回 给 语法 分 析 器 ， 
而 是 继续 寻找 另 一 个 词素 。 第 二 词法 单元 有 一 个 简单 的 正则 表达 式 模 式 i£。 如 果 我 们 在 输入 中 
看 到 两 个 字母 if, 并 且 if 之 后 没有 跟随 其 他 字母 或 数位 ( 如 果 有 的 话 , 词法 分 析 器 会 去 寻找 一 
个 和 id 模式 匹配 的 最 长 输入 前 级 ), 然后 词法 分 析 器 从 输入 中 读 信 这 两 个 字符 , 并 返回 词法 单元 
名 IF, 也 就 是 明示 常量 IF 所 代表 的 整数 值 。 关 键 字 then 和 else 的 处 理 方法 与 此 类 似 。 

第 五 个 词法 单元 的 模式 由 id 定义 。 注 意 , 虽然 像 这 样 的 关键 字 既 和 这 个 模式 匹配 ,也 和 
之 前 的 一 个 模式 匹配 , 但 是 当 最 长 匹配 前 级 和 多 个 模式 匹配 时 , Lex 总 是 选择 最 先 被 列 出 的 模式 。 
当 id 被 匹配 时 , 相应 的 处 理 动 作 分 为 三 步 : 

1) 调用 函数 installID( ) 将 找到 的 词素 放 入 符号 表 中 。 

2) 该 函数 返回 一 个 指向 符号 表 的 指针 。 这 个 指针 被 放 到 全 局 变量 yylval 中 , 并 可 被 语法 
分 析 器 或 编译 器 的 某 个 后 续 组 件 使 用 。 注 意 , 函数 install 1D() 可 以 使 用 以 下 两 个 由 Lex 生成 
的 、 由 词法 分 析 器 自动 赋值 的 变量 : 

e yytext 是 一 个 指向 词素 开头 的 指针 , 与 图 3-3 中 的 lexemeBegin 类 似 。 























© WMA Lex 同 Yacc 一 起 使 用 , 那么 明示 常量 通常 会 在 Yacc 程序 中 定义 ， 并 在 Le 程序 中 不 加 定义 就 使 用 它们 。 因 
H lex.yy.c 是 和 Yace 的 输出 一 起 编译 的 ,因而 这 些 常量 在 Lex 程序 的 动作 中 也 是 可 用 的 。 
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e yyleng 存放 刚 找 到 的 词素 的 长 度 。 





a 
/* definitions of manifest constants 
LT, LE, EQ, NE, GT, GE, 
IF, THEN, ELSE, ID, NUMBER, RELOP */ 
43 
/* regular definitions */ 
delim { \t\n) 
ws {delim}+ 
letter {A-Za-z] 
digit {0-9] 
id {letter} ({letter}|{digit})* 
number {digit}+ (\. {digit}+)?(E[+-]?{digit}+)? 2 
hh 
{us} {/* no action and no return */} 
If {return (IF) ;} 
then {return (THEN) ;} 
else {return (ELSE) ;} 
{id} {yylval = (int) installID(); return(ID);} 
{number} {yylval = (int) installNum(); return (NUMBER) ;} 
en {yylval = LT; return(RELOP) ;} 
get {yylval = LE; return (RELOP) ;} 
nen {yylval = EQ; return(RELOP) ;} 
"<>" {yylval = NE; return(RELOP);} 
pu {yylval = GT; return(RELOP) ;} 
"p=" {yylval = GE; return(RELOP) ;} 
hh 


int installID() {/* function to install the lexeme, whose 
first character is pointed to by yytext, 
and whose length is yyleng, into the 
symbol table and return a pointer 
thereto */ 


} 


int installNum() {/* similar to installID, but puts numer- 
iéal constants into a separate table */ 


} 











图 3-23 ”识别 图 3-12 中 的 词法 单元 的 Lex 程序 


3) 将 词法 单元 名 ID 返回 到 语法 分 析 器 。 

当 一 个 词素 与 模式 number 匹配 时 , 执行 的 处 理 与 此 类 似 , 它 使 用 辅助 函数 installNum( ) 
完成 处 理 。 
3.5.3 Lex 中 的 冲突 解决 

前 面 我 们 已 经 间接 提 到 了 Lex 解决 冲突 的 两 个 规则 。 当 输入 的 多 个 前 缀 与 一 个 或 多 个 模式 
匹配 时 ，Lex 用 如 下 规则 选择 正确 的 词素 ; 

1) 总 是 选择 最 长 的 前 级 。 

2) 如 果 最 长 的 可 能 前 级 与 多 个 模式 匹配 , 总 是 选择 在 Lex 程序 中 先 被 列 出 的 模式 。 
URRA 第 一 个 规则 告诉 我 们 , 要 持续 读 入 字母 和 数位 ,寻找 最 长 的 由 这 些 字符 组 成 的 前 缀 并 
将 它们 组 合成 为 一 个 标识 符 。 它 也 告诉 我 们 应 该 将 <= 看 成 是 一 个 词素 ,而 不 是 将 < 看 作 一 个 词 
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素 、 再 将 = 看 作 下 一 个 词素 。 如 果 我 们 在 Lex PAPE PRE SEAL id 的 模式 之 前 , 那么 第 
二 个 规则 将 使 得 关键 字 成 为 保留 字 。 例 如 , 如 果 then 被 确定 为 和 某 个 模式 匹配 的 最 长 输入 前 
3, 并 且 如 图 3-23 所 示 , 模式 then MBF idl VAT, 那么 返回 的 词法 单元 将 是 THEN, 而 不 是 
ID。 
3.5.4 向 前 看 运算 符 
Lex 自动 地 向 前 谈 人 一 个 字符 , 它 会 读 取 到 形成 被 选 词素 的 全 部 字符 之 后 的 那个 字符 ,然后 
再 回 退 输入 , 使 得 只 有 词素 本 身 从 输入 中 消耗 挤 。 但 是 在 某 些 时 候 , 我 们 希望 仅 当 词素 的 后 面 跟 
随 特定 的 其 他 字符 时 ,这 个 词素 才能 和 某 个 特定 的 模式 相 匹 配 。 在 这 种 情况 下 , 我 们 可 以 在 模式 
中 用 斜 线 来 指明 该 模式 中 和 词 烷 实际 忠 配 的 部 分 的 结尾 , 斜 线 /之 后 的 内 容 表 示 一 个 附加 的 模 
sk, 只 有 附加 模式 和 输入 匹配 之 后 , 我 们 才 可 以 确定 已 经 看 到 了 要 寻找 的 词法 单元 的 词素 , 但 是 
和 第 二 个 模式 匹配 的 字符 并 不 是 这 个 词素 的 一 部 分 。 
在 Fortran 和 一 些 其 他 语言 中 , 关键 字 并 不 是 保留 字 。 这 种 情形 会 产生 一 些 问题 ， 比 
如 下 面 的 语句 

















IF(I, J) =3 3 23 
其 中 , 正 是 一 个 数组 的 名 字 , 而 不 是 关键 字 。 与 这 条 语句 形成 对 比 的 是 下 面 形式 的 语句 : 
IF ( condition ) THEN +- 


在 这 里 , IF 是 一 个 关键 字 。 素 运 的 是 , 我 们 可 以 确定 关键 字 IF 后 面 总 是 跟着 一 个 左 括号 ， 





们 可 以 为 关键 字 IF 写 出 如 下 的 Lex 规则 : 
IF /A\(. x \) {letter} 

这 条 规则 是 说 和 这 个 词素 匹配 的 模式 仅仅 是 两 个 字母 IF。 和 斜 线 表 示 后 面 会 有 一 个 附加 的 模式 ， 
但 是 这 个 模式 并 不 和 词素 匹配 。 在 这 个 附加 模式 中 , 第 一 个 字符 是 左 括号 。 由 于 左 括号 是 Lex 的 
一 个 元 符号 ， 因 此 我 们 必须 在 它 的 前 面 加 上 一 个 反 斜 线 , 说明 它 表 示 的 是 其 字面 含义 。 其 中 的 
-+ 与 “任何 不 包含 换行 符 的 字符 串 ” 匹 配 。 请 注意 , 点 号 是 一 个 Lex 的 元 符号 , 表示 “ 除 换行 符 外 
的 任何 字符 ”。 接 下 来 是 一 个 右 括号 , 同样 也 加 一 个 反 斜 线 使 得 该 字符 表示 其 字面 含义 。 该 附加 
模式 的 最 后 是 符号 letter, 该 符号 是 一 个 正则 定义 , 表示 代表 所 有 字母 的 字符 类 。 

注意 , 为 了 使 该 模式 简单 可 靠 , 我 们 必须 对 输入 进行 预 处 理 , 消除 其 中 的 空白 符 。 在 该 模式 中 , 我 
们 既 没 有 考虑 到 空白 符 , 也 不 能 处 理 条 件 表达 式 跨 行 的 情形 , 因为 点 号 不 能 和 一 个 换行 符 匹配 。 

例如 , 假设 该 模式 被 用 来 匹配 下 面 的 输入 前 绥 : 

IF(A<(B+C) *D) THEN: 
前 两 个 字符 和 正 匹配 , 下 一 字符 和 \( 匹 配 , 接 下 来 的 九 个 字符 和 . * 匹配 , 再 接 下 来 的 两 个 字符 
分 别 和 \) 及 letter 匹配 。 请 注意 , 第 一 个 右 括号 (在 C 的 后 面 ) 后 面 跟 的 不 是 一 个 字母 ， 这 个 事实 
与 问题 不 相关 ,因为 我 们 只 需要 找到 某 种 方式 将 输入 与 模式 相 匹配 。 最 后 我 们 得 出 结论 , 字符 IF 
组 成 一 个 词素 ,并 且 它 们 是 词法 单元 if 的 一 个 实例 。 口 
3.5.5 3.5 节 的 练习 

练习 3. 5. 1: 描述 如 何 对 图 3-23 中 的 Lex 程序 作出 如 下 修改 ; 

1) 增加 关键 字 while。 

2) 将 比较 运算 符 转变 成 C 语言 中 的 同类 运算 符 。 

3) 允许 把 下 划 线 当 作 一 个 附加 的 字母 。 

l 4) 增 加 一 个 新 的 具有 词法 单元 STRING 的 模式 。 该 模式 由 一 个 双 引号 (”) 、 任 意 字 符 串 以 
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及 结尾 处 的 一 个 双 引 号 组 成 。 但 是 , WSEAS |S BE LR IA E S BT Te TIT 
个 反 斜 线 (\) 进 行 转 义 处 理 , 因此 在 该 字符 串 中 的 反 斜 线 将 用 双 反 斜 线 表示 。 这 个 词 法 单元 的 词 
法 值 是 去 掉 了 双 引 号 的 字符 帅 , 并 且 其 中 用 于 转 义 的 反 斜 线 已 经 被 删除 。 识 别 得 到 的 字符 串 将 
被 存放 到 一 个 字符 串 表 中 。 


练习 3. 5. 2: 编写 一 个 Lex 程序 。 该 程序 找 册 一 个 文件 , 并 将 文件 中 每 个 非 空 的 空白 符 序 列 
苦 换 为 单个 空格 。 

练习 3. 5. 3: 编写 一 个 Lex 程序 。 该 程序 拷贝 一 个 C 程序 , 并 将 程序 中 关键 字 float 的 每 个 实 
PRR double, 


| 练习 3. 5. 4: 编写 一 个 Lex 程序 。 该 程序 把 一 个 文件 改变 成 为 “Pig latin" 文 。 明 确 地 讲 ， 
假设 该 文件 是 一 个 用 空白 符 分 隔 开 的 单词 ( 即 字母 串 ) 序 列 。 每 当 你 遇 到 一 个 单词 时 : 

1) 如 果 第 一 个 字母 是 辅音 字母 , 则 将 它 移 到 单词 的 结尾 , 并 加 上 ay. 

2) 如 果 第 一 个 字母 是 元 音字 母 , 则 只 在 单词 的 结尾 加 上 ay. 

所 有 非 字母 的 字符 不 加 处 理 直 接 拷贝 到 输出 。 

| 练习 3. 5.5; 在 SQL 中 , 关键 字 和 标识 符 都 是 大 小 写 不 敏感 的 。 编写 一 个 Lex 程序 , 该 程 
序 识别 (大 小 写字 母 任意 组 合 的 ) 关 键 字 SELECT FROM 和 WHERE 以 及 词法 单元 ID。 考虑 到 这 
个 练习 的 目的 , 你 可 以 把 如 看 成 是 任何 以 一 个 字母 开头 、 由 字母 和 数位 组 成 的 字符 串 。 你 不 必 
将 标识 符 存放 到 一 个 符号 表 中 , 但 需要 指出 这 里 的 “install” 函数 与 图 3-23 中 用 于 描述 大 小 写 敏 感 
标识 符 的 函数 有 何不 同 。 
3.6 有 穷 自 动机 

现在 ， 人 
有 穷 自动 机 (finite automata) 的 表示 方法 。 这 些 自动 机 在 本 质 上 是 与 状态 转换 图 类 似 的 图 ,但 有 
如 下 几 点 不 同 : 

1) 有 穷 自动 机 是 识别 器 (recognizer), 它们 只 能 对 每 个 可 能 的 输入 串 简单 地 回答 “是 ”或 
“AR” 

2) 有 穷 自 动机 分 为 两 类 : 

O 不 确定 的 有 穷 自动 机 ( Nondeterministic Finite Automata, NFA) 对 其 边 上 的 标号 没有 任何 限 
制 。 一 个 符号 标记 离开 同一 状态 的 多 条 边 , 并 且 空 串 e 也 可 以 作为 标号 。 

@ 对 于 每 个 状态 及 自动 机 输入 字母 表 中 的 每 个 符号 , 确定 的 有 穷 自动 机 ( Deterministic Finite 
Automata, DFA) 有 且 只 有 一 条 离开 该 状态 、 以 该 符号 为 标号 的 边 。 

确定 的 和 不 确定 的 有 穷 自动 机 能 识别 的 语言 集合 是 相同 的 。 事 实 上 , 这 些 语言 的 集合 正 
好 是 能 够 用 正则 表达 式 描述 的 语言 的 集合 。 这 个 集合 中 的 语言 称 为 语言 (regular lan- 
guage) © , 
3.6.1 不 确定 的 有 穷 自 动机 

一 个 不 确定 的 有 穷 自 动机 (NFA) 由 以 下 几 个 部 分 组 成 : 

1) 一 个 有 穷 的 状态 集合 So 

















O 这 里 有 个 小 问题 : 按照 我 们 的 定义 , 正则 表达 不 能 描述 空 的 语言 , 因为 我 们 在 实践 中 从 不 会 想到 使 用 这 样 的 模式 。 
但 是 , 有 穷 自动 机 可 以 定义 空 语言 。 在 理论 研究 中 , 乡 被 视 为 一 个 额外 的 正则 表达 式 ,这 个 表达 式 的 用 途 就 是 定义 
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2) 一 个 输入 符号 集合 立 , 即 输入 字母 表 (input alphabet)。 我 们 假设 代表 空 串 的 e 不 是 中 
的 元 素 。 

3) 一 个 转换 函数 (transition function), 它 为 每 个 状态 和 U1el| 中 的 每 个 符号 都 给 出 了 相应 
的 后 继 状 态 (next state) 的 集合 。 

4) S 中 的 一 个 状态 so 被 指定 为 开始 状态 , 或 者 说 初始 状态 。 

5) 5 的 一 个 子 集 玉 被 指定 为 接受 状态 (或 者 说 终止 状态 的 ) 集 合 。 

ANE FE NPA 还 是 DFA, 我 们 都 可 以 将 它 表 示 为 一 张 转换 图 (transition graph) 。 图 中 的 结 点 是 
RE, 带 有 标号 的 边 表示 自动 机 的 转换 函数 。 从 状态 * 到 状态 上 存在 一 条 标号 为 a 的 边 当 且 仅 当 
状态 上 是 状态 ;在 输入 a 上 的 后 继 状 态 之 一 。 这 个 图 与 状态 转换 图 十 分 相似 , 但 是 : 

O 同一 个 符号 可 以 标记 从 同一 状态 出 发 到 达 多 个 目标 状态 的 多 条 边 。 

@) 一 条 边 的 标号 不 仅 可 以 是 输入 字母 表 中 的 符号 , 也 可 以 是 空 符号 串 e。 

RES 53-24 给 出 了 一 个 能 够 识别 正则 表达 式 (alb) * abb 的 语言 的 NFA 的 转换 图 。 这 个 
抽象 的 例子 描述 了 所 有 由 a 和 5 组 成 的 、 以 字符 串 abb 结尾 的 字符 串 。 这 个 例子 将 贯穿 本 节 。 虽 
然 它 很 抽象 , 但 是 实际 上 它 与 一 些 具 有 实际 意义 的 语言 的 正则 表达 式 相 似 。 例 如 , 描述 所 有 其 名 
字 以 .o 结尾 的 文件 的 表达 式 是 any * .o, 其 中 any 表示 任何 可 打印 字符 。 

沿用 状态 转换 图 中 的 惯例 ,状态 3 的 双 图 a 
表明 该 状态 是 接受 状态 。 请 注意 , 从 状态 0 到 gan 
达 接 受 状态 的 所 有 路 径 都 是 先 在 状态 0 上 运行 ao OO 
一 段 时 间 , 然后 从 输入 中 读 取 abb, 分 别 进入 状 
态 1、2 和 3。 因 此 能 够 到 达 接 受 状 态 的 所 有 字 
符 串 都 是 以 abb 结尾 的 。 口 图 3-24 一 个 不 确定 有 穷 自 动机 
3.6.2 HRE 

我 们 也 可 以 将 一 个 NPA 表示 为 一 张 转换 表 
(transition table) ， 表 的 各 行 对 应 于 状态 ,各 列 对 应 于 输入 符号 和 e。 对 应 于 一 个 给 定 状 态 和 给 定 
输入 的 条 目 是 将 NFA 的 转换 函数 应 用 于 这 些 参数 后 得 到 的 值 。 如 果 转 换 函 数 没 有 给 出 对 应 于 某 
个 状态 - 输入 对 的 信息 , 我 们 就 把 O 放 入 相应 的 表 项 中 。 

图 3-25 显示 了 与 图 3.24 的 NFA 对 应 的 转换 表 。 B 

转换 表 的 优点 是 我 们 能 够 很 容易 地 确定 和 一 个 给 定 状态 和 一 个 输入 符号 相对 应 的 转换 。 它 
的 缺点 是 : 如 果 输 入 字母 表 很 大 , 旦 大 多 数 状 态 在 大 多 数 输 入 字符 上 没有 转换 的 时 候 , 转换 表 需 
要 占用 大 量 空间 。 口 
3.6.3 自动 机 中 输入 字符 串 的 接受 i 


a 


RA 

一 个 NFA 接受 (accept) 输 入 字符 串 *， 当 且 仅 当 对 应 的 转换 0 {0,1} {0} 
1 
7 } 
3 




















图 中 存在 一 条 从 开始 状态 到 某 个 接受 状态 的 路 径 , 使 得 该 路 径 中 
各 条 边 上 的 标号 组 成 符号 举 x。 注 意 , 路 径 中 的 标号 将 被 忽略 ， 
因为 空 串 不 会 影响 到 根据 路 径 构建 得 到 的 符号 串 。 
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图 3-25 对 应 于 图 3-24 








PRR) 3-24 NFA 接受 符号 申 aabb， 因为 存在 如 下 从 状 的 NFA 的 转换 表 
态 0 到 达 状 态 3 的 标号 序列 为 aabb 的 了 路径; 
a a b b; 
0 = 0 pani thee w =g 


请 注意 ,可 能 还 存在 多 条 具有 相同 标号 序列 、 但 是 到 达 不 同 状态 的 路 径 。 例 如 下 面 的 路 径 


p 


ERR as 豆 示 的 是 一 个 DFA 的 转换 图 。 该 DFA 接受 人 
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a a b b 
0 - 0 Dea. gam) 


是 另 一 条 从 状态 0 出 发 、 标 号 序列 同样 为 aabb 的 路 径 。 这 条 路 径 最 后 仍 问 到 状态 0, 但 状态 0 不 
是 接受 状态 。 然 而 , 请 记 住 ， 只 要 存在 某 条 其 标号 序列 为 某 符 号 串 的 路 径 能 够 从 开始 状态 到 达 某 
个 接受 状态 ，NFA 就 接受 这 个 符号 串 。 存 在 某 些 到 达 非 接受 状态 的 路 径 并 不 会 影响 这 个 结论 。 




















由 一 个 NFA 定义 (或 接受 ) 的 语言 是 从 开始 状态 到 某 个 a 
接受 状态 的 所 有 路 径 上 的 标号 串 的 集合 。 前 面 提 到 过 ， 图 
3-24 中 的 NFA 定义 的 语言 和 正则 表达 式 (alb) * abb 定义 
的 语言 相同 , 即 所 有 来 自 字母 表 |a, b| HAR abb 结尾 的 串 
的 集合 。 我 们 可 以 用 L(4) 表 示 自 动机 4 接受 的 语言 。 
DEEA 四 3-26 是 一 个 接受 Z(aa* lbb* ) 的 NFA。 因 为 








存在 如 下 的 路 径 : 
€ a a a 
0 a i | =D wR = 2 








字符 串 aaa 被 这 个 NFA 接受 。 请 注意 , 路 径 中 的 @ 标号 在 图 3-26 接受 aa Ibb' 的 NFA 
连接 时 “消失 "了 , 因此 这 条 路 径 的 标号 是 aaa。 
3.6.4 ”确定 的 有 穷 自 动机 

确定 的 有 穷 自动 机 (简称 DFA) 是 不 确定 有 穷 自动 机 的 
一 个 特例 , 其中: 

1) 没有 输入 e 之 上 的 转换 动作 。 

2) 对 每 个 状态 s 和 每 个 输入 符号 a, 有 且 只 有 一 条 标号 为 a 的 边 离开 so 

如 果 我 们 使 用 转换 表 来 表示 一 个 DPA, 那么 表 中 的 每 个 表 项 就 是 -个 状态 。 因 此 , 我 们 可 以 
不 使 用 花 括号 ,直接 写 出 这 个 状态 , 因为 花 括号 只 是 用 来 说 明 表 项 的 内 容 是 一 个 集合 。 

NFA 抽象 地 表示 了 用 来 识别 某 个 语言 中 的 串 的 算法 ， 而 相应 的 DFA 则 是 一 个 简单 具体 的 识 
别 串 的 算法 。 在 构造 词法 分 析 器 的 时 候 , 我 们 真正 实现 或 模拟 的 是 DFA。 幸 运 的 是 , 每 个 正则 表 
达 式 和 每 个 DPA 都 可 以 被 转变 成 为 一 个 接受 相同 语言 的 DFA。 下 边 的 算法 说 明了 如 何 将 DFA 用 
于 串 的 识别 。 
模拟 一 个 DFA。 

输入 : 一 个 以 文件 结束 符 eof 结尾 的 字符 串 x. DFA D 的 开始 状态 为 so, 接受 状态 集 为 , 转 
HRA move, 

输出 : WS DE x, 则 回答 “yes”, 否则 回答 “no”。 = 

方法 : 把 图 3-27 中 的 算法 应 用 于 输入 字符 串 x。 函 数 move | c= nestChar() 
(s, c) 给 出 了 从 状态 * 出 发 ,标号 为 e 的 边 所 到 达 的 状态 。 函 数 | While (cl eof) { 


s = move(s,c); 


nextchar 返回 输入 串 x 的 下 一 个 字符 。 口 c = nextChar(); 





























的 语言 与 图 3.24 的 NFA 所 接受 的 语言 相同 , 都 是 (a1b)*abb。 | “nm | 
给 定 和 输入 册 gbaph iN Be} oe ac pe 
PIA |B} yes o 
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3.6.5 3.6 节 的 练习 

1! 练习 3. 6.1:3.4 节 的 练习 中 的 图 3-19 计算 了 KMP 算法 的 失效 函数 。 说 明 在 已 知 失效 函数 
的 情况 下 , 如 何 根据 已 知 的 关键 字 bbrbn, 构造 出 一 个 具有 n+1 个 状态 的 DFA, 该 DFA 可 以 
识别 语言 bibb (其 中 , 点 代表 任意 字符 ) 。 更 进一步 , 证 明 构 造 这 个 DFA 的 时 间 复 杂 度 是 
O(n)» 

练习 3.6.2: HAY 3.3.5 中 的 每 一 个 语言 设计 一 个 DFA 或 NFA, 

练习 3. 6. 3: 找 出 图 3-29 所 示 的 NFA 中 所 有 标号 为 aabb 的 路 径 。 这 个 NFA 接受 aabb 吗 ? 














a. b a. b a. b 
图 328 接受 (alb) "abb 的 DFA 图 3-29 #5) 3.6.3 AY NFA 

练习 3. 6. 4: 对 于 图 3-30 的 NFA, 重复 练习 3.6.3。 

练习 3. 6.5: 给 出 如 下 练习 中 的 NFA 的 转换 表 : € 

1) 练习 3.6.3。 Re 

2) 练习 3. 6.4。 start 4 th cy 

3) 图 3-26。 CS S © 
3.7 从 正则 表达 式 到 自动 机 

就 像 3. 5 节 的 内 容 所 介绍 的 , 正则 表达 式 非常 图 3-30 练习 3.6.4 的 NFA 


适合 描述 词法 分 析 器 和 其 他 模式 处 理 软件 。 然 而 
那些 软件 的 实现 需要 像 算法 3-18 中 那样 来 模拟 DFA 的 执行 , 或 者 模拟 NFA 的 执行 。 由 于 NFA 
对 于 一 个 输入 符号 可 以 选择 不 同 的 转换 (如 在 图 3-24 中 的 状态 0 上 输入 为 e 时 ) , 它 还 可 以 执行 
输入 e 上 的 转换 (如 在 图 3-26 中 的 状态 0 上 时 ) ,甚至 可 以 选择 是 对 e 或 是 对 真实 的 输入 符号 执 
行 转换 , 因此 对 NFA 的 模拟 不 如 对 DFA 的 模拟 直接 。 于 是 ,我 们 需要 将 一 个 NFA 转换 为 一 个 识 
别 相 同 语言 的 DFA, i 

这 一 节 我 们 将 首先 介绍 如 何 把 NFA 转化 为 DFA。 然 后 , 我 们 利用 这 种 称 为 “ 子 集 构造 法 ”的 
技术 给 出 一 个 直接 模拟 NFA 的 算法 。 这 个 算法 可 用 于 那些 将 NFA 转化 到 DFA 比 直接 模拟 NFS 
更 加 耗 时 的 ( 非 词法 分 析 的 ) 情形 。 接 着 ,我们 将 说 明 如 何 把 正则 表达 式 转换 为 NFA, 在 必要 时 
可 以 根据 这 个 NFA 构造 出 一 个 DFA。 最 后 我 们 讨论 了 不 同 的 正则 表达 式 实现 技术 之 间 的 
时 间 -空间 权衡 问题 , 并 说 明 如 何 为 具体 的 应 用 选择 合适 的 方法 。 
3.7.1 从 NFA 到 DFA 的 转换 

子 集 构造 法 的 基本 思想 是 让 构造 得 到 的 DEA 的 每 个 状态 对 应 于 NFA 的 一 个 状态 集合 。DFA 
在 读 人 输入 ajay a, 之 后 到 达 的 状态 对 应 于 相应 NFA 从 开始 状态 出 发 , 沿 着 以 alaz …a， 为 标 
号 的 路 径 能 够 到 达 的 状态 的 集合 。 

DFA 的 状态 数 有 可 能 是 NFA 状态 数 的 指数 , 在 这 种 情况 下 , 我 们 在 试图 实现 这 个 DFA 时 
会 遇 到 困难 。 然 而 , 基于 自动 机 的 词法 分 析 方 法 的 处 理 能 力 部 分 源 于 如 下 事实 : 对 于 一 个 真 
实 的 语言 , 它 的 NFA 和 DFA 的 状态 数量 大 致 相同 , 状态 数量 旦 指数 关系 的 情形 尚未 在 实践 中 
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输入 : 

输出 : 一 个 接受 同样 语言 的 DFA D。 

方法 : 我 们 的 算法 为 D 构造 一 个 转换 表 Diran。D 的 每 个 状态 是 一 个 NPA 状态 集合 , 我 们 将 
构造 Diran, 使 得 D“ 并 行 地 "模拟 NN 在 过 到 一 个 给 定 输 入 尝 时 可 能 执行 的 所 有 动作 。 我 们 面 对 的 
第 一 个 问题 是 正确 处 理 N 的 se 转换。 在 图 3-31 中 我 们 可 以 看 到 一 些 函 数 的 定义 。 这 些 函 数 描述 
了 一 些 需要 在 这 个 算法 中 执行 的 w 的 状态 集 上 的 基本 操作 。 请 注意 ,s 表示 N 的 单个 状态 , 而 7 
代表 的 一 个 状态 集 。 





操作 描述 
e-closure(s) | 能 够 从 NEA 的 状态 s 开始 只 通过 e 转换 到 达 的 NFA 状态 集合 








e-closure(T) | 能 够 从 T 中 基 个 NFA 状 态 开始 只 通过 e 转换 到 达 的 NEFA 
状态 焦 合 , 即 User €-closure(s) 

move(T, a) 能 够 从 下 中 某 个 状态 s 出 发 通过 标号 为 & 的 转换 到 达 的 
NFA 状 态 的 集合 














图 3-31 NFA 状态 集 上 的 操作 


我 们 必须 找 出 当 NN 读 人 了 某 个 输入 串 之 后 可 能 位 于 的 所 有 状态 和 集合。 首先 , 在 读 人 第 一 
个 输入 符号 之 前 , N 可 以 位 于 集合 e-closure( so) 中 的 任何 状态 上 , 其 中 so 是 入 的 开始 状态 。 下 
面 进行 归纳 。 假 定 X 在 读 人 输入 串 * 之 后 可 以 位 于 集合 了 中 的 状态 上 。 如 果 下 一 个 输入 符号 
Ea, 那么 N 可 以 立即 移动 到 集合 move(T, a) 中 的 任何 状态 。 然 而 , N 可 以 在 读 入 c 后 再 执行 
几 个 e 转 换 , 因此 NN 在读 人 xa 之 后 可 位 于 e-closure( move(T, a)) 中 的 任何 状态 上 。 根 据 这 些 





思想 , 我 们 可 以 得 到 图 3-32 中 显示 的 方法 ,该 方法 构造 了 了 的 状态 集合 Dstates MD 的 转换 函 
数 Dtran, 





一 开始 , e-closure(so) 是 Dstates 中 的 唯一 状态 , 且 它 未 加 标记 ; 
while (在 Dstates 中 有 一 个 未 标记 状态 T ) { 

给 全 加 上 标记 ; 

for ( 每 个 输入 符号 a ) { 
U = e-closure(move(T, a)); 
站 (U 不 在 Dstates 中 ) 

将 U 加 入 到 Dstates 中 , 且 不 加 标记 ; 

DiranlT,a] = U; 








. 图 3-32 子 集 构造 法 
DD 的 开始 状态 是 e-closure( so) , D 的 接受 状态 是 所 有 至 少 包含 了 N 的 一 个 接受 状态 的 状态 集 
合 。 我 们 只 需要 说 明 如 何 对 NFA 的 任何 状态 集合 了 计算 e-closure( T), 就 可 以 完整 地 描述 子 集 构 
造 法 。 这 个 计算 过 程 显示 在 图 3-33 中 。 它 是 从 一 个 状态 集合 开始 的 一 次 简单 的 图 搜索 过 程 , 不 
过 此 时 假设 这 个 图 中 只 存在 标号 为 e 的 边 。 o 
图 3-34 给 出 了 另 一 个 接受 语言 (alb) "abb 的 NFA。 它 正好 是 我 们 将 在 3.7 节 中 根据 
这 个 正则 表达 式 直接 构造 得 到 的 NFA。 我 们 现在 把 算法 3. 20 应 用 到 图 3-34 中 。 
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将 了 的 所 有 状态 压 人 stack 中 ; 
将 e-closure(T) 初始 化 为 了 ; 
while ( stack 非 空 ) { 
将 栈 顶 元 素 ! 弹 出 栈 中 ; 
for (每 个 满足 如 下 条 件 的 &: 从 上 出 发 有 一 个 标号 为 e 的 转换 到 达 状 态 v ) 
if ( u DYE e-closure(T) #2) { 
usa Ble closure(T) 中 ; 
将 4 压 入 栈 中 ; 








图 3-33 计算 e-closure(T) 


等 价 NPA 的 开始 状态 4 是 e-closure(0), 即 4=10,1,2,4,7}。4 中 的 状态 就 是 能 够 从 状态 
0 出 发 , 只 经 过 标号 为 e 的 路 径 到 达 的 所 有 状态 。 请 注意 , 因为 路 径 可 以 不 包含 边 , 所 以 状态 0 
也 是 可 以 从 它 自身 出 发 经 过 标号 为 e 的 路 径 到 达 的 状态 。 

NFA 的 输入 字母 表 是 ja, 5| 。 因 此 , 我 们 的 第 一 步 是 标记 4, 并 计算 Diran[ A, a) = e-closure 
(move(A, a)) 以 及 Dtran[ A, b] =e-closure(move(A,b))。 在 状态 0、1、2、4、7 中, 只 有 2 和 7 有 
a 上 的 转换 , 分别 到 达 状 态 3 和 8, 因此 move(A, a) = 13, 8| ,同时 e-closure( 13, 8|1) := |1, 2, 
3,4,6,7, 8| 。 因 此 我 们 有 : 


Dtran[A, a] = e-closure(move(A,a)) = e-closure({3,8}) = {1,2,3, 4,6,7,8} 


我 们 称 这 个 集合 为 8, 得 到 Diran[4, a] = B, 





图 3-34 (alb) “abb 对 应 的 NFAN 


现在 我 们 要 计算 Diran[ A, 5]。 在 4 的 状态 中 只 有 4 有 一 个 输入 5b 上 的 转换 , CHARS S, 

因此 
Dtran[A, b} = e-closure({5}) = {1, 2,4, 6, 7} 
我 们 称 这 个 集合 为 C, 因此 Dtran[ A, b] =C。 
:人 1 对 未 吉 标 了 和 A st SSN x 

ATE 未 加 标记 的 集合 B A C 继续 这 个 处 理 过 i 
程 , 最 终 会 使 得 这 个 DPA 的 所 有 状态 都 被 加 上 标记 。 这 个 ary 
结论 一 定 正确 , 因为 11 个 NFA 状态 的 集合 只 有 21 个 子 epee 
集 。 我 们 实际 上 构造 出 5 个 不 同 的 DFA 状态 。 这 些 状态 、 | 1,2,4,5,6,7,9) 
它们 对 应 的 NFA 状态 集 以 及 万 的 转换 表 显 示 在 图 3-35 中 。 11,2 4,5, 6, 7, 10} | 
D 的 转换 图 如 图 3-36 所 示 。 状 态 4 E D 的 开始 状态 , 而 包 图 3-35 DFA D 的 转换 表 Diran 
A NFA 状态 10 的 状态 是 唯一 的 接受 状态 。 
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请 注意 ， 相 比 网 3-28 中 接受 相同 语言 (alb) * abb 的 DFA, 这 个 DFA D 多 了 一 个 状态 。D 的 
状态 4 和 C 具有 同样 的 转换 函数 , 因此 可 以 被 侣 并。 我 们 将 在 3. 9.6 中 讨论 使 一 个 DFA 的 状态 


个 数 最 小 化 问题 。 m 
3.7.2 NFA 的 模拟 b 


许多 文本 编辑 程序 使 用 的 策略 是 根据 一 个 正则 
表达 式 构造 出 相应 的 NFA, 然后 使 用 类 似 于 on-the- 
fy( 即 边 构造 边 使 用 的 ) 的 子 集 构 造 法 来 模拟 这 个 b 
NEA 的 执行 。 这 种 模拟 执行 方法 将 在 下 面 给 出 。 
CERA 模拟 一 个 NFA 的 执行 。 SOR 
输入 : 一 个 以 文件 结束 符 eof 24 FE AY ii A AB 
to 一 个 NFA N, 其 开始 状态 为 so ,接受 状态 集 为 & 
F, PARRA move, 3-36 ”将 子 集 构造 法 应 用 于 图 3-34 的 结果 
输出 : 如 果 闪 接受 * 则 返回 "yes”,， BUE E no” o 
方法 : 这 个 算法 保存 了 一 个 当前 状态 的 集合 3S， 即 那些 可 以 从 so 开始 沿 着 标号 为 当前 已 读 入 
输入 部 分 的 路 径 到 达 的 状态 的 集合 。 如 果 c HER RY nextChar( ) 读 到 的 下 一 个 输入 字符 ,那么 我 们 
首先 计算 move(S, c) ,然后 使 用 e-closure 求 出 这 个 集合 的 闭 包 。 该 算法 的 思想 如 图 3-37 所 示 。 
O 








3.7.3 NFA 模拟 的 效率 1) S = e-closure(so); 

如 果 精 心 实现 , 算法 3.22 可 以 相当 高 效 。 因 为 这 些 | 9) c= nertChar); 

高 效 实现 的 思想 可 以 用 于 许多 涉及 图 搜索 的 算法 。 我 们 将 |D while fei 600) eo) 
更 详细 地 介绍 这 个 实现 。 我 们 需要 的 数据 结构 包括 : 5) e= neztChar() 

1) 两 个 堆栈 , 其 中 每 一 个 堆栈 都 存放 了 一 个 NFA 状 | 2) ke SN F != 9 ) return "yes"; 

态 集合 。 其 中 的 一 个 堆栈 oldStates 存放 “当前 状态 集合 ”， | 8) else return "no"; 

即 图 3-37 的 第 4 行 中 右边 的 S 的 值 。 另 一 个 堆栈 newStates 

存放 了 “下 一 个 "状态 集合 , 即 第 4 行 中 左边 的 5 的 值 。 在 SOPR A 

我 们 运行 第 3 行 到 第 6 行 的 循环 时 ,中 间 的 一 个 步骤 没有 在 图 3-37 中 列 出 ， 即 把 newStates 的 值 转 
HF oldStates 中 去 的 步骤 。 

2) 一 个 以 NFA 状态 为 下 标的 布尔 数组 alreadyOn。 它 指示 出 哪个 状态 已 经 在 newStates 中 。 
虽然 这 个 数组 存放 的 信息 和 栈 中 存放 的 信息 相同 , 但 查询 clreadyOn| *] 要 比 在 栈 newStates 中 查询 
s 快 很 多 。 我 们 同时 保持 两 种 表示 方法 的 原因 就 是 为 了 获得 这 个 效率 。 

3) 一 个 二 维 数组 move[s, a], 它 保存 这 个 NFA 的 转换 表 。 这 个 表 中 的 条 目 是 状态 的 集合 ， 
它们 用 链表 表示 。 

为 了 实现 图 3-37 的 第 一 行 ,我们 需要 将 alreadyOn Be astatel) { 

组 中 的 所 有 条 目 都 设置 为 FALSE, 然后 对 于 e-closure (so) 10) 将 s 压 入 栈 newsStates 中 ; 
中 的 每 个 状态 s, 将 s 压 人 oldSiates 并 设置 alreadyOn[s] 为 | 19 ee 
TRUE。 这 个 对 状态 s 的 操作 以 及 图 3-37 第 4 行 中 的 操作 ， | 13) i£ (lolreadyOn i] ) 
都 可 以 使 用 函数 addState (s) 来 实现 。 这 个 函数 将 EA 19) } ieee 
newStates ， 将 alreadyOn [| s |] 设置 为 TRUE， 并 使 用 
movels, e] 作 为 参数 递归 地 调用 自身 ， 继 续 计 算 图 3-38 ”加 入 一 个 不 在 newStates 
e-closure(s) 的 值 。 然 而 , 为 了 避免 重复 工作 , 我 们 必须 小 中 的 新 状态 5 
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A>, 不 要 对 一 个 已 经 在 栈 newStates 中 的 状态 调用 addState, B 3-38 给 出 了 这 个 函数 的 概要 。 
我 们 通过 查看 oldStates 中 的 每 个 状态 s KEME 3-37 的 第 4 行 。 我 们 首先 找 出 状态 集合 
movel s, c], H c 是 下 一 个 答 和 人 字符。 对 于 那些 不 在 newStates 栈 中 的 状态 , 我 们 应 用 项 数 





addState, YEH, addState 还 计算 了 一 个 状态 的 e-closure 值 ， 并 把 其 中 的 状态 一 起 加 人 到 newStates 
中 (如 果 这 些 状态 不 存在 的 话 ) 。 这 一 系列 处 理 步 又 如 网 3-39 所 示 。 
假定 一 个 NFA N 有 个 状态 和 mm 个 转换 ， 即 产 是 离开 
ANS AS tly Hele a By 所 Ho Ay EE A 生出 对 16) for (oldStates 上 的 每 个 s) { 
各 个 状态 的 转换 数 的 总 和 。 如 果 不 包括 第 19 行 中 对 | 1S) POF Osie chato L 
addState 的 调用 ,在 第 16 行 到 第 21 行 的 循环 上 花费 的 时 间 | 18) i ( MareodyOnll]) 
三 ep, > Sf] .EL Ay eve Fay sn AT Nye BEIT ea 19) 1d St te(t); 
是 0(n)。 也 就 是 说 , 我 们 最 多 需要 运行 这 个 循环 nn 遍 , A 20) PE E . 
如 果 不 考 虑 调用 addState 所 花费 的 时 间 , 每 一 遍 的 工作 量 | 20 1} 
都 是 常数 。 对 于 第 22 {7 到 第 26 íT 的 循 环 ’ 这 AN 结 论 th, 22) for (newStalesp HJA 3) { 
2b Oe 23) 将 s 弹 出 newsStates 栈 ， 
成 Y。 pee. Pore _ | 24) 将 s 压 人 oldStates 楼 ; 
在 图 3-39 的 一 次 执行 中 ( 即 图 3-37 的 第 4 行 ), 对 于 | 25) alreadyOn{s] = FALSE; 
26) } 


任意 给 定 的 状态 最 多 只 能 调用 addState 一 次 。 原 因 在 于 每 
次 调用 addState (s) 时 都 会 在 图 3-38 的 第 11 行 上 把 
alreadyOn[ s] BX TRUE, -— H aireadyOn[s] 设 为 TRUE ,图 
3-38 的 第 13 行 和 图 3-39 的 第 18 行 就 会 禁止 再 次 调用 addState(s) 。 

如 果 不 考 虑 第 14 行 中 的 递归 调用 所 花费 的 时 间 , 第 10 行 、 第 11 行 对 addState 的 一 次 调用 所 
花 的 时 间 为 0(1), 第 12、13 行 的 时 间 取 决 于 有 多 少 e 转 换 离开 *。 对 于 一 个 给 定 的 状态 , 我 们 不 
知道 这 个 数目 是 多 少 , 但 是 我 们 知道 最 多 只 有 m 个 离开 各 个 状态 的 转换 。 因 此 , 在 图 3-39 中 代 
码 的 一 次 执行 中 , 在 第 12 行 和 13 行 上 用 于 调用 addState 的 累计 时 间 为 On), IRTE addState 
的 其 他 步 又 的 累计 时 间 为 0(n) ,因为 每 一 次 调用 的 时 间 是 一 个 常数 , 晶 最 多 只 有 次 调用 。 

因此 我 们 可 以 得 出 如 下 绪论， 即 只 要 实现 方法 得 当 , 执行 图 3-37 的 第 4 行 的 时 间 是 
0(n+m)。 从 第 3 行 到 第 6 行 的 while 循环 的 其 余部 分 在 每 次 迭代 时 花费 0(1) 时 间 。 如 果 输 入 x 
的 长 度 为 k, 那么 该 循环 的 总 工作 量 为 0(k(n+t+m))。 图 3-37 的 第 1 行 的 执行 时 间 为 O(n tm), 
因为 它 实 际 上 就 是 图 3-39 中 的 各 个 步骤 ,只 不 过 oldStates 中 只 包含 状态 so。 第 2、7、8 行 都 花费 
0(1) 时 间 。 因 此 ， 如果 实现 正确 , 算法 3. 22 的 运行 时 间 为 0(K(n+m))。 也 就 是 说 , 该 算法 所 
需 时 间 和 输入 串 的 长 度 和 转换 图 的 大 小 ( 结 点 数 加 上 边 数 ) 的 乘积 成 正比 。 








图 3-39 3-37 中 第 4 步 的 实现 














大 ORME 
FEM 0(n) 的 表达 式 是 “最 多 某 个 常数 乘 以 n” 的 缩写 。 从 技术 土 讲 , 我 们 说 一 个 消 数 /(n) 
是 0(g(n) ) 的 条 件 是 存在 常量 c 和 mo 使 得 当 nzno 时 必然 有 f(n) Segeln) IEAI AC) 
能 是 一 个 算法 的 某 些 步 又 的 运行 时 间 。 一 个 有 用 的 写法 是 “0(1)”, 它 表 示 “ 某 个 常量 "。 使 
用 大 0 表示 法 可 以 使 得 我 们 不 需要 过 多 地 考虑 使 用 什么 样 的 运行 时 间 单 位 来 进行 度量 ,而 仍 
然 可 以 表示 一 个 算法 的 运行 时 间 的 增长 速度 。 








3.7.4 从 正则 表达 式 构造 NFA 

现在 我 们 给 出 一 个 算法 , 它 可 以 将 任何 正则 表达 式 转变 为 接受 相同 语言 的 NFA。 这 个 算法 
是 语法 制导 的 ,也 就 是 说 它 沿 着 正则 表达 式 的 语法 分 析 树 自 底 向 上 递归 地 进行 处 理 。 对 于 每 个 
TREA, 该 算法 构造 一 个 只 有 一 个 接受 状态 的 NFA, 
ey 3° 将 正则 表达 式 转 换 为 一 个 NFA 的 McMaughton-Yamada-Thompson 算法 。 
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输入 : 字母 表 半 上 的 -- 个 正则 表达 式 r。 

输出 : 一 个 接受 L(r) 的 NFA Ne 

方法 : 首先 对 7 进行 请 法 分 析 , 分 解 测 组 成 它 的 子 表达 式 。 构 造 一 个 NFA 的 规则 分 为 基本 规 
则 和 归纳 规则 两 组 。 基 本 规则 处 理 不 包含 运算 符 的 子 表达 式 ， 而 归纳 规则 根据 一 个 给 定 表达 式 
的 直接 子 表达 式 的 NFA 构造 出 这 个 表达 式 的 NFA, 

基本 规则 : 对 于 表达 式 e, 构造 下 面 的 NFA. 


Slart © € 人 
这 里 ,i 是 一 个 新 状态 ,也 是 这 个 NFA 的 开始 状态 ; /是 另 -- 个 新 状态 , 也 是 这 个 NFA 的 接 
THEA : 
受 状态 


对 于 字母 表 屋 中 的 子 表达 式 a, 构造 下 面 的 NFA。 


start 
—O—+-© 

同样 ,i 和 都 是 新 状态 , 分 别 是 这 个 NFA 的 开始 状态 和 接受 状态 。 请 注意 , 在 这 两 个 基本 
构造 规则 中 , HF e REA e 的 作为 上 的 子 表达 式 的 每 次 出 现 , 我 们 都 会 使 用 新 状态 分 别 构造 出 
一 个 独立 的 NFA。 l 

归纳 规则 : 假设 正则 表达 式 * 和 1 的 NPA 分 别 为 N(s) 和 N(1)。 

1) 假设 r=slt, r A9 NFA, B N(r), 可 以 按照 图 3-40 中 的 方式 构造 得 到 。 这 里 i 和 /是 新 状 
AS, 分 别 是 N(7) 的 开始 状态 和 接受 状态 。 从 i 到 NN(s) 和 NN(1) 的 开始 状态 各 有 一 个 @ 转换 ， 从 
N(s) 和 NN(t) 到 接受 状态 /也 备 有 一 个 转换 。 请 注意 , N(s) 和 N(1) 的 接受 状态 在 N(7) 中 不 是 
接受 状态 。 因 为 从 i 到 了 的 任何 路 径 要 么 只 通过 N(s), 要 么 只 通过 N(1), HAN i RASA e 
转换 都 不 会 改变 路 径 上 的 标号 , 因此 我 们 可 以 判定 NORI LE) UL(4) ,也 就 是 L(r)。 也 就 是 
说 , 图 3-40 中 的 NFA 是 一 个 正确 的 处 理 并 运算 符 的 构造 。 

2) 假设 r=st, 然后 按照 图 3-41 所 示 构 造 N(r)。N(s) 的 开始 状态 变 成 了 N(7) 的 开始 状态 。 
N(t) 的 接受 状态 成 为 N(7) 的 唯一 接受 状态 。N(s) 的 接受 状态 和 N(t) 的 开始 状态 合并 为 一 个 状 
A, 合并 后 的 状态 拥有 原来 进入 和 离开 合并 前 的 两 个 状态 的 全 部 转换 。 图 3-41 中 一 条 从 i 到 /的 
路 径 必 须 首先 经 过 N), 因此 这 条 路 径 的 标号 以 L(s) 中 的 某 个 串 开 始 。 然 后 , 这 条 路 径 继续 通 
过 NN(1) ,因此 这 条 路 径 的 标号 以 上 (2) 中 的 某 个 串 结束 。 就 像 我 们 很 快要 论证 的 , 没有 转换 离开 
构造 得 到 的 接受 状态 , 也 没有 转换 进入 开始 状态 , 因此 一 个 路 径 不 可 能 在 离开 NN(s) 后 再 次 进入 
N(s)。 因 此 , N(7) 恰 好 接受 L(s)L(?) , 它 是 r=si 的 一 个 正确 的 NFA, 
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图 3-40 两 个 正则 表达 式 的 并 的 NFA 图 3-41 两 个 正则 表达 式 的 连接 的 NFA 


3) 假设 r=s*, 然后 为 > 构造 出 图 3-42 所 示 的 NFA N(r)。 这 里 , i 和 /是 两 个 新 状态 , 分别 
是 N(7) 的 开始 状态 和 唯一 的 接受 状态 。 要 从 i 到达, 我 们 可 以 沿 着 新 引入 的 标号 为 e 的 路 径 前 
进 , 这 个 路 径 对 应 于 Z(s) 中 的 一 个 串 。 我 们 也 可 以 到 达 NE) 的 开始 状态 , 然后 经 过 该 NFA, 再 
零 次 或 多 次 从 它 的 接受 状态 回 到 它 的 开始 状态 并 重复 上 述 过 程 。 这 些 选 项 使 得 W(r) 可 以 接受 
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LCs)! L(s)? SMA rh a RAT A, 因此 NC(7) 识 别 的 所 有 串 的 集合 就 是 L(s) * 

4) 最 后 , 假设 r= (>), WALO) =L(s), 
我 们 可 以 直接 把 N(s) 当 作 NCP) 。 口 

算法 3. 23 中 描述 的 方法 包含 了 一 些 提示 ，“ -CD) 
说 明 为 什么 这 个 归纳 性 构造 方法 能 够 得 到 正确 
的 解答 。 我 们 不 会 给 出 正式 的 正确 性 证 明 。 但 
除了 最 重要 的 性 质 , 即 N(7) 接 受 语言 L(7) 之 外 ， 
我 们 还 在 下 面 列 出 一 些 由 该 算法 构造 得 到 的 
NFA 所 具有 的 性 质 。 这 些 性 质 本 身 也 很 有 趣 , 并 
且 有 助 于 正式 证 明 这 个 方法 的 正确 性 。 

1) N(7) 的 状态 数 最 多 为 + 中 出 现 的 运算 符 和 运算 分 量 的 总 数 的 2 倍 。 得 出 这 个 上 界 的 原因 
是 算法 的 每 一 个 构造 步骤 最 多 只 引信 两 个 新 状态 。 

2) N(r) 有 且 只 有 一 个 开始 状态 和 一 个 接受 状态 。 接 受 状 态 没 有 出 边 , 开始 状态 没有 入 边 。 

3) N(7) 中 除 接受 状态 之 外 的 每 个 状态 要 么 有 一 条 其 标号 为 三 中 符号 的 出 边 , 要 么 有 两 条 标 
号 为 e 的 出 边 。 : 
URA 让 我 们 用 算法 3. 23 为 正则 表达 式 r = (alb) * abb 构造 一 个 NFA, 图 3-43 显示 了 > 
的 一 棵 语法 分 析 树 , 这 棵 树 和 2.2.3 节 中 构造 的 算术 表达 式 的 语法 分 析 树 相似 。 对 于 子 表达 式 
ri ， 即 第 一 个 a, 我 们 构造 如 下 的 NFA, 


start å © 
我 们 在 选择 这 个 NFA 中 的 状态 编号 时 考虑 了 和 接 下 来 生成 的 NFA 的 状态 编号 之 间 的 一 致 
PE Xf r, 构造 如 下 NFA: 




















图 3-42 一 个 正则 表达 式 的 闭 包 的 NPA 





现在 我 们 可 以 使 用 图 3-40 中 的 构造 方法 , 将 N(r) 和 NN(r,) 合 并 , 得 到 7 = rll 的 NFA, 
这 个 NFA 显示 在 图 3-44 中 。 

子 表达 式 74 = (rs) 的 NFA 和 rs 的 NFA 相同 。 子 表达 式 r; = (r3) * 的 NFA 的 构造 如 图 3-45 
所 示 。 我 们 使 用 图 3-42 所 示 的 方法 根据 图 3-44 中 的 NPA 构造 出 这 个 NFA, 
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bs 3-43 (alb) * abb 的 语法 分 析 树 图 3-44 r, ÁJ NFA 
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现在 考虑 r， 它 是 表达 式 中 的 另 一 个 a。 我 们 再 次 对 a 使 用 基本 构造 法 , 但 是 必须 使 用 新 的 
RE BA r 和 re 是 相同 的 表达 式 , 但 这 个 构造 方法 不 允许 我 们 复 用 那个 为 r HER NFA, rg 
的 NFA 如 下 : 

start a 
一 O 一 一 人 @ 

要 得 到 7 =rsre AINEA, 我 们 应 用 图 3-41 中 的 构造 方法 , 将 状态 7 和 7 合并 , 得 到 如 图 3- 46 
所 示 的 NFA。 按 照 这 个 方法 继续 构造 出 两 个 分 别名 为 re 和 ro、 对 应 于 子 表达 式 的 新 NFA, 最 
后 构造 出 如 图 3-34 所 示 的 (alb) * abb 的 NFA, 口 





á is f 
图 3-45 r, 的 NFA 3-46 ry fi) NFA 


3.7.5 字符 串 处 理 算法 的 效率 

我 们 看 到 , 算法 3. 18 能 在 0(lxl1) 时 间 内 处 理 字 符 串 *, 而 在 3.7. 3 节 中 我 们 提 到 , 要 模拟 一 
个 NFA 的 运行 所 需 的 时 间 与 1x1 和 该 NFA 的 转换 图 的 大 小 的 乘积 成 正比 。 很 明显 , 用 DFA 来 模 
拟 比 用 NFA 模拟 更 快 , 因此 我 们 可 能 会 怀疑 模拟 一 个 NFA 到 底 有 没有 意义 。 

”支持 使 用 NFA 模拟 的 论据 之 一 是 子 集 构造 法 在 最 坏 的 情况 下 可 能 会 使 状态 个 数 呈 指数 增长 。 虽 
然 原则 上 DFA 的 状态 数 不 会 影响 算法 3. 18 的 运行 时 间 , 但 是 假如 状态 数 大 到 一 定 程度 , 以 至 于 转换 表 
超过 了 主 存 容量 时 , 那么 真正 的 运行 时 间 就 必须 加 上 磁盘 读 写 时 间 , 从 而 使 运行 时 间 显 著 增 加 。 
ZBE L, = (alb) *a(alb)" 的 正则 表达 式 所 描述 的 语言 族 。 也 就 是 说 , 每 个 语 
BL, 包含 了 所 有 由 a 和 4 组 成 且 从 右 端 向 左 数 第 n 个 符号 是 a 的 串 。 很 容易 构造 出 一 个 具有 
n+1 个 状态 的 NFA。 它 在 任何 输入 符号 上 都 可 以 停留 在 其 初始 状态 , 但 是 当 输 入 为 a 时 也 可 以 
到 达 状 态 1。 在 处 于 状态 1 时 , 它 在 任何 输入 符号 上 都 会 转 到 状态 2, 以 此 类 推 , 当 到 达 状 态 n 时 
它 接受 输入 串 。 图 3-47 给 出 了 这 个 NFA, 


a 


=Q onos -2040 


b 





图 3-47 一 个 NFA, 它 的 状态 数量 远 小 于 等 价 的 最 小 DFA 的 状态 数 


然而 , La 的 任何 一 个 DFA 都 至 少 有 2" 个 状态 。 我 们 不 证 明 这 个 结论 , 只 说 明 其 基本 思想 。 
假设 两 个 长 度 均 为 n AY AB BG DFA 的 同一 个 状态 , 必然 存在 一 些 位 置 使 得 两 个 串 在 这 些 位 置 上 
的 符号 不 同 (必然 一 个 是 a 而 另 一 个 是 5)。 我 们 考虑 最 后 一 个 这 样 的 位 置 。 我 们 可 以 不 断 把 相 
同 的 符号 同时 添加 到 这 两 个 串 的 后 面 , 直到 它们 的 最 后 n ~1 MiB LAS BIA, 但 是 倒数 
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第 nn 个 位 置 上 的 符号 不 同 。 那 么 这 个 DPA 在 处 理 这 两 个 (经 过 扩展 的 ) 符 号 串 时 会 到 达 同 一 个 状 
态 ( 因为 根据 假设 , 此 DFA 在 处 理 未 经 扩展 的 两 个 串 时 到 达 同 一 个 状态 ,而 对 这 两 个 串 的 扩展 方 
法 相同 一 一 译 者 注 ) 。 此 时 这 个 DPA 要 么 同时 接受 这 两 个 符号 串 , 要 么 都 不 接受 这 两 个 符号 串 。 
(注意 这 两 个 符号 串 的 倒数 第 n 个 符号 是 不 同 的 , 它们 应 该 有 且 只 有 一 个 串 在 这 个 语言 中 , 由 此 
得 出 矛盾 。 这 说 明 任 意 两 个 长 度 为 n 的 不 同 符号 串 应 该 到 达 不 同 的 状态 。 而 长 度 为 n 的 符号 串 
共有 2" 个 , 也 就 是 说 至 少 要 有 2" 个 状态 一 一 译 者 注 。) 幸 运 的 是 ,如 我 们 前 面 提 到 的 ,词法 分 析 
很 少 需要 处 理 这 种 类 型 的 模式 ,我 们 也 不 用 担心 会 遇 到 状态 数量 出 奇 多 的 DPA, 口 

然而 , 词法 分 析 器 生成 工具 和 其 他 字符 串 处 理 系统 经 常 以 正则 表达 式 作为 输入 。 我 们 面临 着 将 
正则 表达 式 转换 成 DPA 还 是 NFA 的 问题 。 转 换 成 DFA 的 人 额外 开销 是 在 将 算法 3. 20 应 用 于 转换 得 
到 的 NFA 而 产生 的 开销 (也 可 以 将 一 个 正则 表达 式 直 接 转化 为 DFA, 但 工作 量 实质 上 是 一 样 的 ) 。 
如 果 字 符 串 处 理 器 被 频繁 使 用 ， 比 如 词法 分 析 器 , 那么 转换 到 DFA 时 付出 的 任何 代价 都 是 值得 的 。 
然而 在 另 一 些 字符 串 处 理应 用 中 , 例如 grep, 用 户 指 定 一 个 正则 表达 式 ， 并 在 一 个 或 多 个 文件 中 搜 
索 这 个 表达 式 所 描述 的 模式 , 那么 跳 过 构造 的 DFA 步骤 直接 模拟 NFA 可 能 更 加 高 效 。 

现在 我 们 考虑 用 算法 3. 23 把 正则 表达 式 r 转换 成 相应 的 NFA 的 代价 。 其 关键 步骤 是 构造 
的 语法 分 析 树 。 在 第 4 章 中 我 们 会 看 到 几 种 可 以 在 线性 时 间 内 构造 语法 分 析 树 的 方法 ， 即 在 
OC irl) 时 间 内 完成 语法 分 析 树 的 构造 , 其 中 1ri 表 示 7 的 大 小 , 也 就 是 "中 运算 符 和 运算 分 量 的 总 
和 。 我 们 也 很 容易 发 现 每 次 应 用 算法 3. 23 中 的 基本 规则 和 归纳 规则 只 需要 常数 时 间 , 因此 转换 
得 到 一 个 NFA 所 花费 的 全 部 时 间 是 O(1rf)。 

此 外 ,如 我 们 在 3.7.4 节 中 观察 到 的 , 构造 得 到 的 NFA 最 多 有 21rl 个 状态 和 41rl 个 转换 。 也 
就 是 说 , 根据 3.7. 3 节 中 的 分 析 , 可 以 得 到 n<21rl 和 m41rl。 因 此 , 模拟 这 个 NFA 处 理 输入 字 
符 串 x 的 过 程 所 花费 时 间 是 OC 1rl x 1x1)。 这 个 时 间 远 远 超过 构造 NPA 所 用 的 了 时间 0( irl). Al 
此 , 我 们 得 到 ,对 于 正则 表达 式 > 和 字符 串 x, 能 够 在 OC rl x lx1) 时 间 内 判断 x 是否 属于 上 (7)。 

子 集 构造 法 所 花费 的 时 间 很 大 程度 上 取决 于 构造 得 到 的 DEA 的 状态 数 。 首 先 注意 在 图 3-22 
所 示 的 子 集 结构 法 中 , 算法 的 关键 步 又 , 即 根 据 状 态 集 T 和 和 输入 符号 a 构建 状态 集 U 的 过 程 与 算 
法 3. 22 的 NFA 模拟 方法 中 根据 旧 状 态 集 构造 新 状态 集 的 过 程 类 似 。 我 们 已 经 知道 , 如果 实现 得 
当 , 这 个 步骤 所 花 的 时 间 最 多 和 NFA 状态 数 与 转换 数 之 和 成 正比 。 

假设 我 们 要 从 一 个 正则 表达 式 > 开 始 , 并 将 它 构造 成 一 个 NFA。 这 个 NFA 最 多 有 21r! 个 状 
态 和 41rl 个 转换 , 并 且 最 多 有 214rl 个 输入 符号 。 因 此 , 对 于 每 个 构造 得 到 的 DFA 状态 , 我 们 最 多 
必须 构造 1r1 个 新 状态 , 构造 每 个 新 状态 最 多 花费 0(21rl +41rl) 时 间 。 因 此 , 构造 一 个 有 ;个 状 
态 的 DFA 所 用 的 时 间 为 O(1rl2s) 。 

在 通常 情况 下 , s 大 约 等 于 1r| ， 上面 的 子 集 构 造 法 H 
需要 的 时 间 为 Ori). RM, 在 如 例 3.25 所 示 的 最 | 

















每 个 中 的 开销 | 


O(lr| x [z}) 


自动 机 | 初始 开销 
NFA O(r) 





























坏 情况 下 , 这 个 时 间 是 0( 1r1?21")。 当 我 们 需要 构造 DFA typical case | O(\r|*) Oflzl) 
一 个 识别 器 来 指明 一 个 或 多 个 串 “是 否 在 一 个 给 定 的 “| DEA worst case | OPa) | Ota 





ERA r BE LE LO) PAL, RATS THM. E E 
图 3 48 对 这 些 选 项 作 了 总 结 。 语言 的 不 同方 法 所 具有 的 初始 开销 和 
如 果 处 理 各 个 字符 串 所 花 的 时 间 多 很 多 ,比如 per 
我 们 构造 词法 分 析 器 时 面临 的 情况 , 我们 显然 倾向 。 
于 使 用 DFA。 然 而 , 在 像 grep 这 样 的 命令 中 ,我 们 只 会 对 一 个 符号 串 运行 这 个 自动 机 。 此 时 我 们 
通常 价 向 于 使 用 NFA 方式 。 只 有 当 1x1 接 近 171? 的 时 候 , 我 们 才 会 考虑 转换 到 DPA, 
还 有 一 种 混合 策略 可 以 做 到 对 每 个 正则 表达 式 + 和 输入 串 , 它 的 效率 总 是 和 DIA 和 NFA 
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方法 中 较 好 的 一 个 差不多 。 这 个 策略 从 模拟 NFA 开始 , 但 是 在 计算 出 各 个 状态 集 ( 也 就 是 DFA 
的 状态 ) 和 转换 的 同时 把 它们 记录 下 来 。 在 模拟 中 每 次 处 理 此 NFA 的 当前 状态 集合 和 当前 输入 
符号 之 前 ,首先 查看 我 们 是 否 已 经 计算 了 这 个 转换 。 如 果 是 , 就 直接 使 用 这 个 信息 。 
3.7.6 3.7 节 的 练习 

练习 3.7.1: 将 下 列 图 中 的 NFA 转换 为 DFA。 

1) 图 3-26 

2) 图 3-29 

3) 图 3-30 

练习 3.7.2: 用 算法 3. 22 模拟 下 列 图 中 的 NPA 在 处 理 输入 aabb 时 的 过 程 。 

1) 图 3-29 

2) Fl 3-30 

练习 3.7.3: 使 用 算法 3.23 和 3. 20 将 下 列 正则 表达 式 转换 成 DFA。 

1) (alb)* 

2) (ařib*)* 

3) ( (ela)b*) * 

4) (alb) *abb(alb) * 


3.8 词法 分 析 器 生成 工具 的 设计 

本 节 中 我 们 将 应 用 3.7 节 中 介绍 的 技术 , 讨论 像 Lex 这 样 的 词法 分 析 器 生成 工具 的 体系 结 
构 。 我 们 将 讨论 两 种 分 别 基 于 NFA 和 DFA 的 方法 , 后 者 实质 上 就 是 Lex 的 实现 方法 。 
3.8.1 生成 的 词法 分 析 器 的 结构 

图 3-49 概括 了 由 Lex 生成 的 词法 分 析 器 的 体系 结构 。 作 为 词法 分 析 器 的 程序 包含 一 个 固定 
的 模拟 自动 机 的 程序 。 现 在 我 们 暂时 不 规定 这 个 自动 机 是 确定 的 还 是 不 确定 的 。 词 法 分 析 器 的 
其 他 部 分 是 由 Lex 根据 Lex 程序 创建 的 组 件 组 成 的 。 











这 些 组 件 包括 : 

1) 表示 自动 机 的 一 个 转换 表 。 

2) 由 Lex 编译 器 从 Lex 程序 中 直接 拷 输入 缓冲 区 
贝 到 输出 文件 的 函数 ( 见 3. 5.2 节 的 讨论 )。 词素 

3) 输入 程序 定义 的 动作 。 这 些 动 作 是 lexeme Begin forward 
一 些 代码 片段 ， 将 在 适当 的 时 候 由 自动 机 村 
拟 器 调用 。 自动 机 






模拟 器 


在 构建 自动 机 时 , 我 们 首先 用 算法 
3. 23 把 Lex 程序 中 的 每 个 正则 表达 式 模式 
转换 为 一 个 NFA。 我 们 需要 使 用 一 个 自动 
机 来 识别 所 有 与 Lex 程序 中 的 模式 相距 配 的 
词素 , 因此 我 们 将 这 些 NFA 合并 为 一 个 
NFA。 合 并 的 方法 是 引 人 一 个 新 的 开始 状 。 图 3-49 一 个 Lex 程序 被 转变 成 由 有 限 自动 
AS, 从 这 个 新 开始 状态 到 各 个 对 应 于 模式 pi 人 
的 NFA Ni 的 开始 状态 各 有 一 个 。 转换。 构造 方法 如 图 3-50 所 示 。 
我 们 将 使 用 如 下 所 述 的 简单 、 抽 象 的 例子 来 说 明 本 节 所 要 说 明 的 思想 : 






转换 表 
动作 
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a { 模式 P 的 动作 A, | 
abb i 模式 pa 的 动作 An} 


a*b+ {Bist p 的 动作 44 | 
请 注意 ,上述 三 个 模式 之 间 存 在 我 们 在 3. 5.3 节 中 讨论 过 的 冲突 。 更 明确 地 说 , AR abb 
同时 满足 第 二 个 和 第 三 个 模式 , 但 是 我 们 将 把 它 看 作 模 式 ps 的 词素 , 因为 在 上 面 的 Lex 程序 中 
首先 列 出 的 是 模式 p,_。 像 ab10… 这 样 的 输入 串 有 很 多 前 缀 都 满足 第 三 个 模式 ，Lex 的 规则 是 接 
受 最 长 的 前 缀 ,因此 我 们 不 断 读 和 信 5， 直到 另 一 个 4 出 现 为 止 。 此 时 我 们 报告 识别 的 词素 就 是 从 
第 一 个 a 开始 的 、 包 含 了 其 后 所 有 6 的 符号 串 。 





图 3-50 ”根据 Lex 程序 构造 得 到 的 一 个 NFA 


图 3-51 列 出 了 分 别 识别 这 三 个 模式 的 NFA。 其 中 第 三 个 NFA 是 根据 算法 3.23 的 转换 结果 
经 简化 得 到 的 。 然 后 , 图 3-52 显示 了 通过 加 入 一 个 新 开始 状态 0 和 3 个 转换 将 这 三 个 NFA 合 
并 后 得 到 的 单个 NFA。 c 


OOO 0 LOENG) 








b b 
图 3-51 a, abb 和 a*b* 的 NFA 图 3-52 合并 后 的 NFA 


3.8.2 基于 NFA 的 模式 匹配 

如 果 词 法 分 析 器 模拟 了 像 一 个 图 3-52 所 示 的 NFA, 那么 它 必须 从 它 的 输入 中 lexemeBegin 所 
指 的 位 置 开始 读 取 输 入 。 当 它 在 输入 中 向 前 移动 jorward 指针 时 ,， 它 在 每 个 位 置 上 根据 算法 3. 22 
计算 当前 的 状态 集 。 

在 这 个 模拟 NEA 运行 的 过 程 中 , 最 终 会 到 达 一 个 没有 后 续 状 态 的 输入 点 。 那 时 , 不 可 能 有 
任何 更 长 的 输入 前 级 使 得 这 个 NFA 到 达 某 个 接受 状态 ， 此 后 的 状态 集 将 一 直 为 空 。 于 是 ,我们 
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就 可 以 判定 最 长 前 织 ( 与 菜 个 模式 匹配 的 词素 ) 是 什么 。 

我 们 沿 着 状态 集 的 顺序 回头 寻找 ， 直 到 找到 一 个 包含 一 个 或 多 个 接受 状态 的 集合 为 止 。 如 
果 集 合 中 有 多 个 接受 状态 , 我 们 就 选择 和 在 Lex 程序 中 位 置 最 靠 前 的 模式 相关 联 的 那个 接受 状态 
Pio 我 们 将 forward 指针 移 回 到 词素 来 尾 ,， 同 时 执行 与 已 相关 联 的 动作 Ajo 
假设 我 们 有 例 3. 26 所 示 的 模式 ， 并 且 输 入 字符 串 以 aaba 开头 。 如 果 图 3.52 中 的 
NFA 从 初始 状态 0 的 e- 闭 包 , 即 10,，1, 3, 7), 开始 处 理 输入 , 那么 它 进入 的 状态 集合 的 序列 如 图 
3.53 所 示 。 在 读 人 第 四 个 输入 符号 之 后 , 我 们 处 于 一 个 空 状 态 集中 ,因为 在 图 3-52 中 没有 在 输 
Aa 上 离开 状态 8 的 转换 。 











b a b* a 


一 it 一 人 
8 none 
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图 3-53 ”在 处 理 输入 aaba 时 进入 的 状态 集 的 序列 

因此 , 我 们 要 向 回 寻 找 一 个 包含 了 某 个 接受 状态 的 状态 集 。 请 注意 , 如 图 3-53 所 示 , 在 读 人 
a 之 后 , 我 们 所 在 的 状态 集 包含 状态 2, 这 表明 模式 a 已 经 被 匹配 。 然 而 在 读 人 aab 之 后 , 我 们 在 
状态 8 中 , 这 表明 模式 a* b+ 被 匹配 ; ME aab 是 最 长 的 使 我 们 到 达 某 个 接受 状态 的 前 缀 。 因 此 
我 们 选择 aab 作为 被 识别 的 词素 , 并 且 执行 4;。 这 个 动作 应 该 包含 一 个 返 加 语句 ,向 语法 分 析 器 
指明 已 经 找到 了 一 个 模式 为 ps = ab 的 词法 单元 。 
3.8.3 词法 分 析 器 使 用 的 DFA 

另 一 种 体系 结构 和 Lex 的 输出 相似 , 它 使 用 算法 3. 20 中 的 子 集 构造 法 将 表示 所 有 模式 的 
NFA 转换 为 等 价 的 DFA。 在 DFA 的 每 个 状态 中 , 如 果 该 状态 包含 一 个 或 多 个 NPA 的 接受 状态 ， 
那么 就 要 确定 哪些 模式 的 接受 状态 出 现在 此 DFA 状态 中 , 并 找 出 第 一 个 这 样 的 模式 。 然 后 将 该 
模式 作为 这 个 DFA 状态 的 输出 。 
DERG ”使 用 子 集 构造 法 可 以 根据 图 3-52 中 的 NFA 构造 得 到 一 个 DFA。 图 3-54 显示 了 这 个 
DFA 的 一 个 转换 图 。 图 中 的 接受 状态 都 用 该 状态 所 标识 的 模式 作为 标号 。 例 如 , 状态 16, 818 
两 个 接受 状态 , 分 别 对 应 于 模式 abb 和 a* b+ 。 由 于 前 一 个 模式 先 被 列 出 ,因此 该 模式 就 是 状态 
16, 8] 所 关联 的 模式 。 时 




















a*bt abb 


图 3-54 处理 模式 a abb Fla’ b* Ay DFA 的 转换 图 
在 词法 分 析 器 中 ,我 们 使 用 DFA 的 方法 与 使 用 NFA 的 方法 很 相似 。 我 们 模拟 这 个 DFA 的 运 
行 , 直到 在 某 一 点 上 没有 后 续 状 态 为 止 (严格 地 说 应 该 是 下 一 个 状态 为 乞 ,， 即 对 应 于 空 的 NPA 状 
态 集合 的 死 状 态 ) 。 此 时 , 我 们 回头 查找 我 们 进入 过 的 状态 序列 , 一旦 找到 接受 状态 就 执行 与 该 
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状态 对 应 的 模式 相关 联 的 动作 。 








假设 图 3-54 中 的 DFA 的 输入 为 abba。 处 理 输入 时 进入 过 的 状态 序列 为 0137、247 、 
58、68。 在 读 人 最 后 一 个 a 时, 没有 离开 状态 68 的 相应 转换 。 因 此 , 我 们 从 后 向 前 考察 这 个 状态 
序列 。 在 这 个 例子 中 , 68 本身 就 是 一 个 接受 状态 , 对 应 于 模式 pa = abb。 口 


3.8.4 实现 向 前 看 运算 符 
回顾 3. 5.4 节 可 知 ，Lex 模式 mr 中 的 Lex 向 前 看 运算 符 / 是 必 不 可 少 的 。 因 为 有 时 为 了 正 
确 地 识别 某 个 词法 单元 的 实际 词素 , 我 们 需要 指明 在 这 个 词法 单元 的 模式 六 之 后 必须 跟着 模式 
roo ERRI mr 转化 成 NFA 时 , 我 们 把 /看 成 e, 因此 我 们 实际 上 不 会 在 输入 中 查找 /。 然 而 ， 
如 果 NFA 发 现 输 入 缓冲 区 的 -- 本 这 个 词素 的 末尾 并 不 在 这 个 
NFA 进入 接受 状态 的 地 方 。 实 际 上 ，, 这 个 末尾 是 在 此 NFA 进入 满足 如 下 条 件 的 状态 s 的 地 方 : 
1) 在 (假想 的 )/ 上 有 一 个 e 转 换 。 
2) 有 一 条 从 NFA 的 开始 状态 到 状态 s( 相应 标号 序列 为 x) 的 路 径 。 
3) 有 一 条 从 状态 s 到 NFA 的 接受 状态 (相应 标号 序列 为 y) 的 路 径 。 
4) 在 所 有 满足 条 件 1~3 的 xy 中 ,x 尺 可 能 长 。 
: ey NFA TR 有 e A 30 所 示 ， Rs 


的 状态 s 的 问题 就 会 变 得 

图 3-55 的 NFA 识别 例 3. 13 中 给 出 的 IF 模式 。 这 个 模式 使 用 了 向 前 看 运算 符 。 请 注 
意 ,从 状态 2 到 状态 3 的 e 转换 就 代表 这 个 向 前 看 运算 符 。 状 态 6 表明 关键 字 IF 的 出 现 。 然 而 ， 
当 进 入 状态 6 时 , 我 们 需要 向 回 扫描 到 最 有 晚 出 现 的 状态 2 才 可 以 找到 词素 IF。 口 











DFA 中 的 死 状态 

从 技术 上 讲 , 图 3-54 中 的 自动 机 并 不 是 一 个 真正 的 DFA。 因 为 DFA 中 的 每 个 状态 在 它 
的 输入 字母 表 中 的 每 个 符号 上 都 有 一 个 离开 转换 。 这 里 我 们 省 略 了 到 达 死 状态 8 的 转换 ,并 
且 我 们 也 省 略 了 从 这 个 死 状态 出 发 、 在 所 有 输入 符号 上 到 达 其 自身 的 转换 。 前 面 的 NFA 到 
DFA 转换 的 例子 中 不 存在 从 开始 状态 到 达 8 的 路 径 , 但 是 图 3-52 中 的 NFA 有 这 样 的 路 径 。 

然而 ， 当 我 们 构造 一 个 用 于 词法 分 析 器 的 DFA 时 , 重要 的 是 , 我 们 必须 用 不 同 的 方式 来 
处 理 死 状态 ,因为 我 们 必须 知道 什么 时 候 Ee ! 别 到 更 长 的 词素 了 。 因 此 我 们 建议 省 
略 到 达 死 状态 的 转换 ,并 消除 死 状态 本 身 。 实 际 上 这 个 问题 要 比 看 起 来 困难 一 些 , 因为 一 个 
NFA 到 DFA 的 构造 过 程 可 能 会 产生 多 个 不 可 能 到 达 接 受 状态 的 DFA 状态 。 我 们 必须 知道 何 
时 到 达 了 一 个 这 样 的 状态 。3. 9.6 节 讨论 了 如 何 将 这 些 状态 合并 为 一 个 死 状态 ， 这 使 得 识别 
这 些 状态 变 得 容易 。 还 要 指出 的 是 ,如 果 我 们 使 用 算法 3.20 和 3. 23 根据 -一 个 正则 表达 式 构 
造 出 一 个 DFA, 那么 得 到 在 DFA 中 除 O IPAS IH AT AR AS AB MY BIASES BEAL AR AS 
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图 3-55 ”识别 关键 字 IF 的 NFA 


start 
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3.8.5 3.8 节 的 练习 

练习 3. 8. 1: 假设 我 们 有 两 个 词法 单元 ; (1 ) 关 键 字 if, (2) aR, 它 表示 除 if 之 外 的 所 
有 由 字 好 组 成 的 旱 。 请 给 出 : 

1) 识别 这 些 词法 单元 的 NFA. 

2) 识别 这 些 词 法 单元 的 DFA. 

练习 3. 8.2: 对 如 下 的 词法 单元 重复 练习 3.8.1: (1) 关 键 字 while，(2) 关键 字 when, 
(3) 标 识 符 , 它 代表 以 字母 开头 、 由 字母 和 数位 组 成 的 字符 串 。 

| 练习 3. 8. 3: 假设 我 们 修正 DFA 的 定义 , 使 得 每 个 状态 在 每 个 输入 符号 上 有 零 个 或 一 个 转 
换 ( 而 不 是 像 标 准 的 DFA 定义 中 那样 恰好 有 一 个 转换 ) 。 那 么 , 有 些 正 则 表达 式 就 可 以 具有 相 比 
按 标准 定义 构造 得 到 的 DFA 而 言 更 小 的 *DFA”。 给 出 这 种 正则 表达 式 的 一 个 例子 。 

! 1 练习 3.8.4: 设计 一 个 算法 来 识别 形 如 mAra 的 Lex 向 前 看 模式 , 其 中 m Mr, 都 是 正则 
表达 式 。 说 明 该 算法 如 何 处 理 如 下 输入 : 
1) (abedlabe)/d 
2) (alab)/ba 








3) aa*/a* 
3.9 基于 DFA 的 模式 匹配 器 的 优化 

我 们 将 在 本 节 中 给 出 三 个 算法 , 这 些 算法 用 于 实现 和 优化 根据 正则 表达 式 构造 得 到 的 模式 
匹配 器 。 


1) 第 一 个 算法 可 以 用 于 Le 编译 回 , 因为 它 不 需 构造 中 间 的 NFA 就 可 以 根据 一 个 正则 表达 
式 直接 构造 得 到 DFA。 同 时 , 得 到 的 DFA 的 状态 数 也 比 通过 NFA 构造 得 到 的 DFA 的 状态 数 少 。 

2) 第 二 个 算法 可 以 将 任何 DFA 中 具有 相同 未 来 行为 的 多 个 状态 合并 , 从 而 使 该 DFA 的 状态 
数量 减 到 最 少 。 这 个 算法 本 身 相 当 高 效 , 它 的 时 间 复 杂 度 仅 有 O(nlogn), 其 中 是 被 处 理 的 
DFA 的 状态 数量 。 

3) 第 三 个 算法 可 以 生成 比 标准 二 维 表 更 加 紧凑 的 转换 表 的 表示 方式 。 
3.9.1 NFA 的 重要 状态 

在 讨论 如 何 根据 一 个 正则 表达 式 直 接生 成 DFA 之 前 , 我 们 必须 首先 深入 分 析 算 法 3. 23 构建 
NFA 的 过 程 , 并 考虑 各 种 状态 所 扮演 的 角色 。 如 果 一 个 NFA 状态 有 一 -个 标号 非 e 的 离开 转换 ， 
那么 我 们 称 这 个 状态 是 重要 状态 (important state ) 。 请 注意 , 子 集 构 造 法 (算法 3.20) 在 计算 
e-closure( move( T, a) )( 即 可 以 从 了 出 发 在 输入 a 上 到 达 的 状态 的 集合 ) 的 时 候 , 它 只 使 用 了 集合 
了 中 的 重要 状态 。 也 就 是 说 ， 只 有 当 状 态 * 是 重要 的 , 状态 集合 move(s, a) 才 可 能 是 非 空 的 。 在 
子 集 构造 法 的 应 用 过 程 中 ,两 个 NFA 状态 集合 可 以 被 认为 是 一 致 的 ( 即 把 它们 当 作 同一 个 集合 来 
处 理 ) 条 件 是 它们 : 

1) 具有 相同 的 的 重要 状态 , H 

2) 要 么 都 包含 接受 状态 , 要 么 都 不 包含 接受 状态 。 

如 果 这 个 NFA 是 使 用 算法 3. 23 根据 一 个 正则 表达 式 生 成 的 , 那么 我 们 还 可 以 指出 更 多 的 关 
于 重要 状态 的 性 质 。 重 要 状态 只 包括 在 基础 规则 部 分 为 正则 表达 式 中 某 个 特定 符号 位 置 引 人 的 
初始 状态 。 也 就 是 说 ,每 个 重要 状态 对 应 于 正则 表达 式 中 的 某 个 运算 分 量 。 

此 外 , 构造 得 到 的 NFA 只 有 一 个 接受 状态 , 但 该 接受 状态 (没有 离开 转换 ) 不 是 重要 状态 。 
我 们 可 以 在 一 个 正则 表达 式 7 的 右 端 连接 一 个 独特 的 右 端 结束 标记 符 #, 使 得 > 的 接受 状态 增加 
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一 个 在 # 上 的 转换 ,使 之 成 为 (7)# 的 NFA 的 重要 状态 。 换 句 话说， 通过 使 用 扩展 的 ( augment) IE 
则 表达 式 (7)#, 我 们 可 以 在 构造 过 程 中 不 考虑 接受 状态 的 问题 。 当 构造 过 程 结束 后 , 任何 在 # 上 
有 离开 转换 的 状态 必然 是 一 个 接受 状态 。 

NFA 的 重要 状态 直接 对 应 于 正则 表达 式 中 存放 了 字母 表 中 符号 的 位 置 。 使 用 抽象 语法 树 来 
表示 扩展 的 正则 表达 式 是 非常 有 用 的 。 该 语法 分 析 树 的 叶子 结 点 对 应 于 运算 分 量 , 内 部 结 点 表 
示 运 算 符 。 标 号 为 连接 运算 符 (。) 、 并 运算 符 !、 星 号 运算 符 * 的 内 部 结 点 分 别称 为 cat 结 点 、or 
结 点 和 star 结 点 。 我 们 可 以 使 用 2. 5.1 节 中 处 理 算术 表达 式 的 方法 来 构造 一 个 正则 表达 式 对 应 的 
抽象 语法 树 。 


ARRI 图 3-56 是 一 个 正则 表达 式 的 抽象 语法 树 。 其 中 的 小 圆 略 表 示 cat 结 点 。 口 





图 3-56 (alb) ”abb# 的 抽象 语法 树 
抽象 语法 树 的 叶子 结 点 可 以 标号 为 e, 也 可 以 用 字母 表 中 的 符号 作为 标号 。 对 于 每 一 个 标号 
不 为 e 的 叶子 结 点 ,我们 赋予 一 个 独 有 的 整数 。 我 们 将 这 个 整数 称 为 叶子 结 点 的 位 置 ( position) , 
同时 也 表示 和 它 对 应 的 符号 的 位 置 。 请 注意 , 一 个 符号 可 以 有 多 个 位 置 。 比 如 , 在 图 3-56 F, a 
有 位 置 1 和 位 置 3。 抽 象 语法 树 中 的 这 些 位 置 对 应 于 构造 出 的 NFA 中 的 重要 状态 。 
URIA 图 3-57 显示 了 对 应 于 图 3-56 中 的 正则 表达 式 的 NFA, 其 中 的 重要 状态 已 经 被 编号 , 而 其 他 
状态 则 用 字母 表示 。 我 们 很 快 就 会 看 到 ，NFA 的 编号 状态 和 抽象 语法 树 中 的 位 置 是 如 何 对 应 的 。 | oO 
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图 3-57 ”使 用 算法 3.23 构造 得 到 的 (alb) ”abb# 的 NFA 
3.9.2 根据 抽象 语法 树 计 算得 到 的 函数 
要 从 一 个 正则 表达 式 直 接 构 造 出 DEA, 我 们 要 首先 构造 它 的 抽象 语法 树 , 然后 计算 如 下 四 个 
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函数 : nullable, firstpos , lastpos 和 oliowpos。 每 个 图 数 的 定义 都 用 到 了 一 个 特定 增 广 正 则 表达 式 
(r)# 的 抽象 语法 树 。 

1) nullable(n) 对 于 一 个 抽象 语法 树 结 点 为 真 当 且 仅 当 此 结 点 代表 的 子 表达 式 的 语言 中 包 
SZE e CURED, 这 个 子 表达 式 可 以 “生成 空 串 ”或 者 本 身 就 是 空 串 ， 即使 它 也 可 能 表示 一 些 
其 他 的 串 。 

2) firstpos(n) 定 义 了 以 结 点 为 根 的 子 树 中 的 位 置 集 合 。 这 些 位 置 对 应 于 以 为 根 的 子 表达 
式 的 语言 中 某 个 串 的 第 一 个 符号 。 

3) lastpos(n) 定义 了 以 结 点 为 根 的 子 树 中 的 位 置 集合 。 这 些 位置 对 应 于 以 于 为 根 的 子 表 达 
式 的 语言 中 某 个 串 的 最 后 一 个 符号 。 

4) followpos(p) 定 义 了 一 个 和 位 置 p 相关 的 、 抽 象 语 法 树 中 的 某 些 位 置 的 集合 。 一 个 位 置 9 在 
followpos(p) P 3 BHF L (1) #) PENSE RB x = alaz …aa， 使 得 我 们 在 解释 为 什么 x 属于 
LDAN, 可 以 将 x 中 的 某 个 a; 和 抽象 语法 树 中 的 位 置 匹配 , 且 将 位 置 ci ,1 和 位 置 4 匹配 。 
AE E 考虑 图 3-56 中 对 应 于 表达 式 (alb)”a 的 cat An, Rili nullable(n) = false, [Al 
为 这 个 结 点 生成 所 有 以 a 结尾 的 由 a、5b 组 成 的 串 ; 它 不 生成 空 串 e。 而 另 一 方面 , 它 下 面 的 
star 结 点 是 可 以 为 空 , 它 的 正则 表达 式 生 成 e 以 及 所 有 由 c、 组 成 的 串 。 i 

firstpos(n) = |1,2, 3] o 在 由 nw 对 应 的 正则 表达 式 生 成 的 像 aa 这 样 的 串 中 , 该 串 的 第 一 个 位 
置 对 应 于 树 中 的 位 置 1; FR ba 这 样 的 串 中 , 串 的 第 一 个 位 置 来 自 于 树 中 的 位 置 2。 然 而 ， 当 由 
n 代表 的 正则 表达 式 生成 的 串 仅 包含 时 , 这 个 a 来 自 于 位 置 3。 

lastpos(n) = 131。 也 就 是 说 , 不 管 结 点 壮 的 表达 式 生 成 什么 串 ,， 该 串 的 最 后 一 个 位 置 总 是 来 
自 位 置 3 上 的 a, 

followpos 的 计算 要 困难 一 些 , 但 是 我 们 很 快 会 给 出 计算 这 个 函数 的 规则 。 下 面 是 推导 得 到 
followpos 值 的 一 个 例子 : followpos(1) = 11,2,3|。 考 虑 一 个 串 …ac…, 其 中 c 代 表 a 或 5, 且 a 来 
自 位 置 1。 也 就 是 说 , 这 个 a 是 由 表达 式 (alb)* 中 的 a 生成 的 多 个 4 之 一 。 这 个 a 后 面 可 以 跟 
随 由 同一 表达 式 (alb)* 生成 的 a 或 6, 此 时 c 来 自 位 置 1 或 位 置 2。 也 有 可 能 这 个 a BRAN 
(alb)* 生 成 的 串 的 最 后 一 个 字符 , 那么 c 一定 是 来 自 位 置 3 的 a。 因 此 , 1、2、3 就 是 可 以 跟 在 
位 置 1 后 的 位 置 。 口 
3.9.3 计算 nullable、firstpos 及 lastpos 

我 们 可 以 使 用 一 个 对 树 的 高 度 直接 进行 递归 的 过 程 来 计算 nullable, firstpos 和 lastpos, YE 
图 3-58 中 总 结 了 计算 nullable 和 firstpos 的 基本 规则 和 归纳 规则 。 计 算 lastpos 的 规则 在 本 质 上 和 计 
算 firstpos 的 规则 相同 , 但 是 在 针对 cat 结 点 的 规则 中 , 子 结 点 cl 和 cy 的 角色 需要 对 调 。 






























































结 点 也 nullable(n) | firstpos(n) 
—MREA ¢ HH FER true 0 
一 个 位 置 为 的 叶子 结 点 false {i} 

一 个 or- 结 点 n= 二 cllcz | nullable(c,) or | firstpos(cy) U firstpos(c2) 
nullable(co) 
一 个 cat- 结 点 n 二 cicz | nullable(c)) and if ( nullable(cı) ) 
nullable(c2) firstpos(c,) U firstpos(ce) 
else firstpos(c,) 
一 个 star- 结 点 n= 0" firstpos(c1) 











图 3-58 ”计算 nullable 和 firstpos 的 规则 
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在 图 3-56 的 语法 树 的 所 有 结 点 中 ， es 的。 由 图 3-58 可 知 , 图 中 
的 所 有 时 子 结 点 都 是 不 可 为 空 的 , 因为 它们 都 对 应 于 非 e 运算 分 量 。 图 3-56 中 的 or 结 点 是 不 可 


为 空 的 , 因为 它 的 子 结 点 都 不 可 为 空 。 图 中 的 star- 结 点 是 可 空 wy 因为 这 是 star 结 点 的 特征 之 

一 。 最后， 网 3-56 中 的 所 有 cat 结 点 (至少 > 包含 一 个 不 可 为 空 的 子 结 点 ) 都 是 不 可 为 空 的 。 
对 备 个 结 点 的 firstpos 和 lastpos 的 计算 结 (1,2,3} o (6) 

采 显 示 在 图 3-59 中 ,其 中 , firstpos(n) 显示 在 

结 点 的 左边 ,lastpos (n) 显示 在 结 点 右边 。 {1,2,3} o 15) t6) #16) 

每 个 时 子 结 点 的 Jirstpos 和 lastpos RL GE A ne a B 7 (3) 

Ey, 这 是 由 图 3-58 中 关于 非 e 叶子 结 点 的 规 

则 决定 的 。 图 3-56 中 的 or 结 点 的 firstpos 和 (12,3) o 13) {4} 6 (4) 

lastpos 分 别 是 它 的 所 有 子 结 点 的 firstpos 和 2 

lastpos 的 并 集 。 针 对 star 结 点 的 规则 是 ， 它 (L2) * (L2) ves 

的 firstpos 及 lastpos 4p Sf ME TAES | 


{1,2} 1 (1,2) 


firstpos 和 lastpos . oe ie 

最 后 考虑 最 下 面 的 cat- 结 点 , 我 们 将 把 oy ay pp 
这 个 结 点 称 为 mm。 要 计算 firstpos(n), p 首 
pi ae ang 是 否 可 为 空 
个 例子 里 面 , 左 运算 分 量 可 以 为 空 n 
的 firstpos 是 它 的 各 个 子 结 点 的 firstpos 的 并 集 , 也 就 是 |1, 2) U13) =11,2, 31, E 3-58 中 没有 
明确 说 明 lastpos 的 运算 规则 , 但 是 前 面 提 到 过 , 它 的 规则 和 firstpos 的 规则 相同 ， 只 是 需要 互 换 子 
结 点 的 角色 。 也 就 是 说 , 要 计算 lastpos(n), 我 们 需要 知道 它 的 右 子 结 点 (位 置 为 3 的 叶子 结 点 ) 
BAAS. EAA ABS, 因此 lastpos (nn) 就 是 它 的 右 子 结 点 的 lasipos， 即 {31。 
3.9.4 计算 followpos 

最 后 , 我 们 来 了 解 一 下 如 何 计算 函数 followpos。 只 有 两 种 情况 会 使 得 一 个 正则 表达 式 的 菜 个 
位 置 会 跟 在 另 一 个 位 置 之 后 : 

1) 如 果 是 一 个 cat 结 点 ， 且 其 左右 子 结 点 分 别 为 c 、cz， 那么 对 于 lastpos( c; ) 中 的 每 个 位 
F i, firstpos( c3) 中 的 所 有 {EERE followpos(i) 中。 

2) 如 果 Æ star 结 点 , IFA i HE lastpos(n) 中 的 一 个 位 置 , OBA firstpos(n) 中 的 所 有 位 置 都 在 
ee i) 中 。 
E 现在 让 我 们 继续 考虑 那个 贯穿 全 节 的 例子 。 同 顾 一 下 ， ig 和 lastpos 已 经 在 图 
3-59 中 计 算出 来 了 。followpos 的 计算 规则 1) 要 求 我 们 查看 每 个 ca 结 点 ， 并 将 它 的 右 子 结 点 的 
firstpos 中 的 每 个 位 置 放 到 它 的 左 子 结 点 的 lastpos 中 的 各 个 位 置 的 中 。 对 于 图 3-59 中 最 
下 面 的 cat 结 点 , 该 规则 说 位 置 3 在 followpos(3) 和 followpos(2) 中 。 其 上 一 个 cat 结 点 说 4 在 万/- 
lowpos(3) 41, 余下 的 两 个 cat 结 点 告诉 我 们 5 在 followpos(4) "1, 6 Æ followpos(5) P a 

我 们 还 必须 对 star 结 点 应 用 规则 2。 该 规则 告诉 我 们 位 置 1 和 2 BETE followpos( 1) 中 又 在 followpos 
(2) 中， 因为 这 - 个 结 ; 点 的 firstpos 和 lastpos 都 是 11, 2| 。 图 3-60 给 出 了 全 部 的 plowpos 集合 。 o 

我 们 可 以 创建 一 个 有 向 图 来 表示 函数 followpos ,其 中 每 个 位 置 有 一 个 对 应 的 结 点 , 从 位 置 i 到 位 置 ] 
有 一 条 有 向 边 当日 仅 当 j 在 follorwwpos(i) 中 。 图 3-61 显示 的 有 向 图 表示 了 图 3- 60 所 示 的 folloupos 函数 。 

ERRE, RR followpos 函数 的 有 向 图 几乎 就 是 相应 的 正则 表达 式 的 不 包含 < 转换 的 NFA. 

如 果 我 们 进行 下 面 的 处 理 , 这 个 图 就 恋 成 了 这 样 的 一 个 NFA。 


图 3-59 (alb) ”abb# 的 语法 分 析 树 的 结 点 
的 firstpos 和 lastpos 
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1) 将 根 结 点 的 firstpos 中 的 所 有 位 置 设 为 开始 状态 。 
2) 在 每 条 从 到 了 的 有 向 边 上 添加 位 置 守 上 的 符号 作为 标号 。 
3) 把 和 结尾 # 相 关 的 位 置 当 作 唯 一 的 接受 状态 。 


followpos(n) 
? ~ -人 一 一 个 一 一 全 


图 3-60 PRL followpos -图 3-61 表示 函数 jollorwpos 的 有 向 图 

3.9.5 根据 正则 表达 式 构建 DFA 
从 一 个 正则 表达 式 r 构造 DFA。 

输入 : 一 个 正则 表达 式 ro 

输出 : 一 个 识别 L(7) 的 DFA D, 

方法 : . 

1) 根据 扩展 的 正则 表达 式 (7)# 构 造 出 一 棵 抽象 语法 树 To 

2) 使 用 3.9.3 节 和 3.9.4 节 的 方法 , 计算 得 到 了 的 函数 nullable, firstpos 、lastpos 和 followposo 

3) 使 用 图 3- 62 中 所 示 的 过 程 , 构造 出 D 的 状态 集 Dstates 和 D 的 转换 函数 Diran。D 的 状态 
就 是 了 中 的 位 置 集合 。 每 个 状态 最 初 都 是 “未 标记 的 ”， 当 我 们 开始 考虑 某 个 状态 的 离开 转换 时 ， 

















该 状态 变 成 “已 标记 的 "。D 的 开始 状态 是 firstpos (no), 其 中 结 点 no 是 了 的 根 结 点 。 这 个 DFA 的 
接受 状态 集合 是 那些 包含 了 和 结束 标记 # 对 应 的 位 置 的 状态 。 品 





初始 化 Dstates ,使 之 只 包含 未 标记 的 状态 firstpos(no), 
其 中 mo 是 (7) 玲 的 抽象 语法 树 的 根 结 点 ; 
while ( Dstates 中 存在 未 标记 的 状态 5S ) { 
标记 5; 
for (每 个 输入 符号 a ) { 
令 UU 为 5 中 和 & 对 应 的 所 有 位 置 p 的 followpos(p) 的 并 集 ; 
if ( U FIE Dstatest? ) 
将 这 作为 未 标记 的 状态 加 入 到 Dstates 中 ; 
Dtran[S,a] = U; 











图 3-62 ”从 一 个 正则 表达 式 直 接 构造 一 个 DFA 

现在 我 们 可 以 把 我 们 的 连续 使 用 的 例子 的 各 个 步骤 综合 起 来 , 为 正则 表达 式 r= (al 
b) * abb 构造 一 个 DFA。(r)# 的 语法 分 析 树 如 图 3-56 所 示 。 我 们 观察 到 , ARORA HP, 
只 有 star 4 (i nullable 为 真 。 我 们 将 通 数 firstpos 和 lastpos 显示 在 图 3-59 Fo PHA followpos 的 值 
显示 在 图 3-60 中 。 

这 棵 树 的 根 结 点 的 firstpos 的 值 是 11, 2,3}, 因此 D 的 开始 状态 就 是 这 个 集合 。 我 们 称 这 个 集合 为 
4。 我 们 必须 计算 Diran[4, a] Fil Diran[A, 6], FEA 的 位 置 中 , 1 和 3 对 应 于 a, 而 2 对 应 于 6。 因此 Dt- 
ran[A, a] = followpos(1) Ufollowpos(3) = |1, 2,3, 4}; Dtran[A, b] = followpos(2) = {1,2,3|。 后 
一 个 集合 就 是 4, 因此 不 需要 加 入 到 Dstates 中 。 但 是 前 一 个 状态 集 8= 11, 2, 3, 4| 是 新 状态 , 因此 我 
们 将 它 加 入 到 Dirans 中 并 计算 它 的 转换 。 完 整 的 DFA 如 图 3-63 所 示 。 口 











图 3-63 根据 图 3-57 构造 得 到 的 DFA 


3.9.6 最 小 化 一 个 DFA 的 状态 数 

对 于 同一 个 语言 , 可 以 存在 多 个 识别 此 语言 的 DRA。 例 如 , 图 3-36 和 图 3-63 中 的 DFA 都 识 
别 语言 L((alb) *abb) 。 这 两 个 DFA 不 但 各 个 状态 的 名 字 不 同 ， 就 连 它们 的 状态 个 数 也 不 一 样 。 
如 果 我 们 使 用 DPA 来 实现 词法 分 析 器 , 我 们 总 是 希望 使 用 的 DEA 的 状态 数量 尽 可 能 地 少 , 因为 
描述 词法 分 析 器 的 转换 表 需 要 为 每 个 状态 分 配 条 目 。 

状态 名 字 的 问题 是 次 要 的 。 如 果 我 们 只 需 改 变 状态 名 字 就 可 以 将 一 个 自动 机 转换 成 为 另 一 
个 自动 机 , 我 们 就 说 这 两 个 自动 机 是 同 构 的 。 图 3-36 和 图 3-63 中 的 两 个 自动 机 不 是 同 构 的 。 然 
而 , 这 两 个 自动 机 的 状态 之 间 有 很 紧密 的 关系 。 图 3-36 中 的 状态 4 和 C 实际 上 是 等 价 的 ， 因 为 
它们 都 不 是 接受 状态 , 且 对 任意 输入 , 它们 总 是 转 到 同一 个 状态 一 一 在 输入 a 上 转 到 8, 在 输入 4 
上 转 到 Co 不仅 如 此 , 状态 4 和 C 的 行为 都 和 图 3- 63 中 的 状态 123 相似 。 类 似 地 , 图 3.36 中 状 
AS B 的 行为 和 图 3-63 中 状态 1234 的 行为 相似 , 状态 D 的 行为 和 状态 1235 的 行为 相似 , 状态 的 
行为 和 状态 1236 的 行为 相似 。 

可 以 得 出 一 个 重要 的 结论 : 任何 正则 语言 都 有 一 个 唯一 的 (不 计 同 构 ) 状 态 数 日 最少 的 DFA。 
而 且 , 从 任意 一 个 接受 相同 语言 的 DFA 出 发 , 通过 分 组 合并 等 价 的 状态 , 我 们 总 是 可 以 构建 得 到 
这 个 状态 数 最 少 的 DFA。 对 于 L( (alb) *abb), 图 3-63 就 是 状态 最 少 的 DFA, 将 图 3-36 中 DFA 
的 状态 划分 为 | A, C) IB] 1D} {EE 然后 合并 等 价 状态 就 可 以 得 到 这 个 最 小 DPA. 

我 们 将 给 出 一 个 将 任意 DFA 转化 为 等 价 的 状态 最 少 的 DPA 的 算法 。 该 算法 首先 创建 输入 DFA 
的 状态 集合 的 分 划 。 为 了 理解 这 个 算法 , 我 们 要 了 解 输入 串 是 如 何 区 分 各 个 状态 的 。 如 果 分 别 从 状 
态 s 和 + 出 发 , 沿 着 标号 为 x 的 路 径 到 达 的 两 个 状态 中 只 有 一 个 是 接受 状态 , 我 们 说 串 x 区 分 状态 
和 t+。 如 果 存 在 某 个 能 够 区 分 状态 s 和 状态 : HR, 那么 它们 就 是 可 区 分 的 (distinguishable) 。 
CUE 空 串 e 可 以 区 分 任何 一 个 接受 状态 和 非 接受 状态 。 在 图 3-36 中 , E b 区 分 状态 4 和 
B, 因为 从 4 出 发 经 过 标号 为 b 的 路 径 会 到 达 非 接受 状态 C, 而 从 B 出 发 则 到 达 接 受 状态 有 。 O 

DFA 状态 最 小 化 算法 的 工作 原理 是 将 一 个 DFA 的 状态 集合 分 划 成 多 个 组 , 每 个 组 中 的 各 个 
状态 之 间 相 互 不 可 区 分 。 然 后 , 将 每 个 组 中 的 状态 合并 成 状态 最 少 DFA 的 一 个 状态 。 算 法 在 执 
行 过 程 中 维护 了 状态 集合 的 一 个 分 划 , 分 划 中 的 每 个 组 内 的 各 个 状态 尚 不 能 区 分 , 但 是 来 自 不 同 
组 的 任意 两 个 状态 是 可 区 分 的 。 当 任意 一 个 组 都 不 能 再 被 分 解 为 更 小 的 组 时 ,这 个 分 划 就 不 能 
再 进一步 精 化 ， 此 时 我 们 就 得 到 了 状态 最 少 的 DFA。 

最 初 , 该 分 划 包 含 两 个 组 : 接受 状态 组 和 非 接受 状态 组 。 算 法 的 基本 步 又 是 从 当前 分 划 中 取 
一 个 状态 组 ， 比 如 4 = fsi, ss，…, sx| ,并 选 定 某 个 输入 符号 a, 检查 a 是 否 可 以 用 于 区 分 4 中 
的 某 些 状 态 。 我 们 检查 51, ss, …, si 在 a 上 的 转换 ,如果 这 些 转 换 到 达 的 状态 落 人 当前 分 划 的 
两 个 或 多 个 组 中 , 我 们 就 将 4 分 割 成 为 多 个 组 , 使 得 # 和 * 在 同一 组 中 当 且 仅 当 它们 在 a 上 的 转 
换 都 到 达 同一 个 组 的 状态 。 我 们 重复 这 个 分 割 过 程 ， 直 到 无 法 根据 某 个 输入 符号 对 任意 个 组 进 
行 分 割 为 止 。 这 个 思想 体现 在 下 面 的 算法 中 。 | 
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状态 最 小 化 算法 的 原理 

我 们 需要 证 明 两 个 性 质 : 仍然 位 于 Innw 的 同一 组 中 状态 不 可 能 被 任意 串 区 分 ,以 及 最 后 
存在 于 不 同 子 集 中 的 状态 之 间 是 可 区 分 的 。 要 证 明 第 一 个 性 质 , 需要 对 算法 3-39 中 步骤 2 的 
迭代 次 数 进行 归纳 。 如 果 在 步骤 2 的 第 i 次 近 代 之 后 s 和 1 在 同一 子 组 中 , 那么 就 不 存在 长 度 
小 于 等 于 i 的 串 可 以 将 s 和 4 区 分 开 。 请 读者 自行 完成 这 个 归纳 证 明 。 

第 二 个 性 质 的 证 明 也 是 通过 对 和 迭代 次 数 的 归纳 来 完成 的 。 如 果 在 步 又 2 的 第 i 次 迭代 时 
RE s 和 上 被 放 在 不 同 的 组 中 , 那么 必然 存在 一 个 吝 可 以 区 分 它们 。 归 纳 的 基础 很 容易 证 明 
当 s Alt 放 在 初始 分 划 的 不 同 组 中 时 , 它们 必然 一 个 是 接受 状态 , 另 一 个 是 非 接 受 状态 。 因 ” 
此 ee 就 可 以 区 分 它们 。 妇 纳 步 骤 如 下 : 必然 存在 一 个 输入 符号 a 和 状态 p、g, 使 得 * 和 上 在 输 
入 a 上 分 别 进入 状态 p Mg HE pAg 必定 已 经 被 放 到 不 同 的 组 中 了 。 那 么 根据 归纳 假设 ， 
必然 存在 某 个 串 % 可 以 区 分 p 和 gq。 因 此 可 知 ax 能 够 区 分 s 和。 











i 
Pee) 最 小 化 一 个 DFA 的 状态 数量 。 
输入 : 一 个 DFA D, 其 状态 集合 为 5, 输入 字母 表 为 Z,， 开始 状态 为 so， 接受 状态 集 为 F。 
输出 : 一 个 DFA D', 它 和 也 接受 相同 的 语言 , 且 状 态 数 最 少 。 : 
方法 : 
1) 首先 构造 包含 两 个 组 F 和 5S -下 的 初始 划分 TL, 这 两 个 组 分 别 是 D 的 接受 状态 组 和 非 接 
受 状态 组 。 


2) 应 用 医 3-64 的 过 程 来 构造 新 的 分 划 Manew o 


最 初 , 令 Mew = M 
for ( 开 中 的 每 个 组 G ) { 
将 G 分 划 为 更 小 的 组 ， 使 得 两 个 状态 s 和 在 同一 小 组 中 当 且 仅 当 对 于 所 有 
的 输入 符号 a， RAs 和 上 在 2 上 的 转换 都 到 达 开 中 的 同一 组 ; 
/* 在 最 坯 情 况 下 ， 每 个 状态 各 自 组 成 一 个 组 */ 
E Tew PAF G BRA MG 进行 分 划 得 到 的 那些 小 组 ; 














3-64 ,的 构造 
3) 如 果 Mew = M, 令 Ia = 开 并 接着 执行 步骤 4; 否则 , 用 Iaev 替 换 工 并 重复 步骤 2。 
4) 在 分 划 Inna 的 每 个 组 中 选取 一 个 状态 作为 该 组 的 代表 。 这 些 代 表 构 成 了 状态 最 少 DFA 
D' 的 状态 。D' 的 其 他 部 分 按 如 下 步 又 构建 : 
© D' 的 开始 状态 是 包含 了 D 的 开始 状态 的 组 的 代表 。 
QD' 的 接受 状态 是 那些 包含 了 的 接受 状态 的 组 的 代表 。 请 注意 , 每 个 组 中 要 么 只 包含 接 
受 状态 , 要 么 只 包含 非 接 受 状态 , 因为 我 们 一 开始 就 将 这 两 类 状态 分 开 了 , 而 图 3-64 中 
的 过 程 总 是 通过 分 解 已 经 构造 得 到 的 组 来 得 到 新 的 组 。 
S s Æ IIswa 中 某 个 组 6 的 代表 , IFS DFA D PERA a LAR s 的 转换 到 达 状 态 i。 Sr 
为 ;所 在 组 也 的 代表 。 那 么 在 D' 中 存在 一 个 从 * 到 7 存 输 入 a 上 的 转换 。 注 意 , ED, 
组 6 中 的 每 一 个 状态 必然 在 输入 a 上 进入 组 五 中 的 某 个 状态 , 否则 , 组 6 应 该 已 经 被 图 
3-64 的 过 程 分 割 成 更 小 的 组 了 。 








这 个 最 小 化 算法 有 时 会 产生 带 有 一 个 死 状态 的 DFA。 所 请 死 状 态 就 是 在 所 有 输入 符号 上 都 转 | 
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每 个 输入 符号 上 都 必须 有 一 个 转换 。 然 而 , 如 3.8.3 节 所 讨论 的 , 我 们 需要 知道 在 什么 时 候 已 经 不 
存在 被 这 个 DFA 接受 的 可 能 性 了 , 这 样 我 们 才能 知道 已 经 识别 到 了 正确 的 词素 。 央 此 , 我 们 希望 
消除 死 状 态 , 并 使 用 一 个 缺少 某 些 转换 的 自动 机 。 这 个 自动 机 的 状态 比 状态 最 少 DFA 的 状态 少 一 
个 ,但 是 因为 缺少 了 一 些 到 达 死 状态 的 转换 , 所 以 严格 地 讲 它 并 不 是 一 个 DFA。 

















让 我 们 重新 考虑 图 3-36 中 给 出 的 DFA。 初 始 分 划 包 括 两 个 组 {A, B, C, DI, [E], 
它们 分 别 是 非 接受 状态 组 和 接受 状态 组 。 构 造 TL, AY, 图 3-64 中 的 过 程 考 虑 这 两 个 组 和 输入 符 
号 o 和 0。 因为 组 | 了 | 只 包含 一 个 状态 , 不 能 再 被 分 割 , 所 以 1E| 被 原封 不 动 地 保留 在 Threw Po 

另 一 个 组 14, B, C, DI 是 可 以 被 分 割 的 , 因此 我 们 必须 考虑 各 个 输入 符号 的 作用 。 在 输入 a 上， 
这 些 状态 中 的 每 一 个 都 转 到 8, 因此 使 用 以 a 开头 的 串 无 法 区 分 这 些 状态 。 但 对 于 输入 5b, RSA, B 
和 C 都 转换 到 组 {4, B, C, D1 的 某 个 成 员 上 , 而 DD 转 到 男 一 个 组 中 的 成 员 E ko REE Mie P, 组 
1A, B, C, D1 被 分 割 为 |4, B, C| 和 1D|。 这 一 轮 得 到 的 了,.。 是 14, B, CIDHE 

在 下 一 轮 中 , 我 们 可 以 把 14, B, Cj} 分割 为 {4, C)B), 因为 4 和 (在 输入 上 都 到 达 LA, 
B, Cl 中 的 元 素 , 但 B 却 转 到 男 一 个 组 中 的 元 素 D 上 。 央 此 在 第 二 轮 之 后 , May = 14, CIB! 
iD11E|。 在 第 三 轮 中 ,我们 不 能 够 天 分割 当前 分 划 中 了 唯一 一 个 包含 多 个 状态 的 组 14, Cl, 因为 
A 利 C 在 所 有 输入 上 都 进入 同一 个 状态 (因此 也 就 在 同一 组 中 )。 因 此 我 们 有 Tsww = {14, CHIBI 
{DI} El. 

现在 我 们 将 构建 出 状态 最 少 DFA。 它 有 4 个 状态 , 对 应 于 Isna 中 的 四 个 组 。 我们 分 别 挑选 
A4、B、D 和 EE 作为 这 四 个 组 的 代表 。 其 中 , 状态 4 是 开始 状态 , 状态 是 唯一 的 接受 状态 。 它 的 
转换 函数 如 图 3-65 所 示 。 例 如 , 在 输入 5 上 离开 状态 的 转换 到 达 状 态 4, 因为 在 原来 的 DFA 
H, EEA b EEA C, 而 4 是 C 所 在 组 的 代表 。 因 为 同样 的 原因 , 在 输入 上 离开 4 的 状态 
回 到 4 本身 ， 而 其 他 的 转换 都 和 图 3-36 中 的 相同 。 



































3.9.7 ”词法 分 析 器 的 状态 最 小 化 | 状态 [ole] 

如 果 要 将 状态 最 小 化 算法 应 用 于 3. 8.3 节 中 生成 的 DPA, 我 们 必须 在 算 | 本 BTA 
法 3. 39 中 使 用 不 同 的 初始 分 划 。 我 们 会 将 识别 某 个 特定 词法 单元 的 所 有 状 | 了 Ble 
态 放 到 对 应 于 此 词法 单元 的 一 个 组 中 , 同时 把 所 有 不 识别 任何 词法 单元 的 状 | E | BIA 
态 放 到 另 一 组 。 下 面 用 一 个 例子 来 说 明 这 个 扩展 。 ga BEA 
对 于 图 3-54 的 DFA, 初始 分 划 为 DPA 的 转换 表 


{0137, 7} {247} {8, 58}{68} {6} 

其 中 , 状态 0137 和 7 分 在 同一 组 的 原因 是 它们 都 没有 识别 任何 词法 单元 ; 状态 8 和 58 分 在 一 组 
的 原因 是 它们 都 识别 词法 单元 a* b+ 。 请 注意 , 我 们 添加 了 一 个 死 状态 8, 我 们 假设 它 在 输入 a 
和 hb 时 会 转 到 它 自身 。 这 个 死 状态 同时 也 是 状态 8、58 和 68 在 输入 a 上 的 目标 状态 。 

我 们 必须 将 0137 和 7 DIF, 因为 它们 在 输入 a 上 转 到 不 同 的 组 。 我 们 也 要 把 8 和 58 分 开 ， 
因为 它们 在 输入 5 上 转 到 不 同 的 组 。 这 样 ， 所 有 的 状态 都 自 成 一 组 。 图 3-54 所 示 的 DFA 就 是 识 
别 这 三 个 词法 单元 的 状态 最 少 DFA。 请 记 住 ,被 用 作词 法 分 析 器 的 DFA 通常 会 丢掉 它 的 死 状态 ， 
同时 我 们 把 所 有 消失 的 转换 当 作 结束 词法 单元 识别 过 程 的 信号 。 口 
3.9.8 DFA 模拟 中 的 时 间 和 空间 权衡 


最 简单 和 最 快捷 的 表示 一 个 DFA 的 转换 函数 的 方法 是 使 用 一 个 以 状态 和 字符 为 下 标的 二 维 表 。 l 
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给 定 一 个 状态 和 下 一 个 输入 字符 ,我 们 访问 这 个 数组 就 可 以 找 出 下 一 个 状态 以 及 我 们 必须 执行 的 特殊 
动作 ,比如 将 一 个 词法 单元 返回 给 语法 分 析 器 。 由 于 词法 分 析 器 的 DPA 中 通常 包含 数 百 个 状态 , SEAL 
涉及 ASCH RR Ay 128 个 输入 字符 ,因此 这 个 数组 需要 的 空间 少 于 -一 兆 字 节 。 

但 是 , 在 一 些小 型 的 设备 中 也 可 能 使 用 编译 器 。 对 于 这 些 设备 来 说 ,即使 一 兆 内 存 也 显得 太 
大 了 。 对 于 这 种 情况 , 可 以 应 用 很 多 方法 来 压缩 转换 表 。 比 如 , 我 们 可 以 用 一 个 转换 链表 来 表示 
每 个 状态 , 这 个 转换 链表 由 字符 - 状态 对 组 成 。 我 们 在 链表 的 最 后 存放 一 个 默认 状态 : 对 于 没有 
出 现在 这 个 链表 中 的 字符 , 我 们 总 是 选择 这 个 状态 作为 县 标 状态 。 

还 有 一 个 更 加 巧妙 的 数据 结构 ,， 它 既 利 用 了 数组 表示 法 的 访问 速度 ,又 利用 了 带 默 认 值 的 链 
表 的 压缩 特性 。 我 们 可 以 把 这 个 结构 看 作 四 个 数组 ， 如 图 3-66 所 示 令 。 其 中 的 base 数组 用 于 确 
定 状 态 * 的 条 目的 基准 位 置 。 这 些 条 目 位 于 数组 next 和 check 中 。 如 果 数 组 check 告诉 我 们 由 
basel s] 给 出 的 基准 位 置 不 正确 , 那么 我 们 就 使 用 数组 default 来 确定 另 一 个 基准 位 置 。 

在 计算 nextstate(s, a) WT, 即 计 算 状 态 ; 在 输入 a da basé nea hock 
上 的 后 继 状 态 时 , 我们 首先 查看 数组 next 和 check 中 


在 位 置 ! = base[s] + a LHRH, Ro 被 当 作 
0 ~127 之 间 的 整数 。 如 果 check[ 1] = s, 那么 这 个 条 fi 























目 是 有 效 的 ， 状态 s 在 输入 a 上 的 后 继 状 态 就 是 
next[1] ; 如 果 check[1] # s, 那么 我 们 得 到 另 一 个 状 r t 
At = default[s], 并 把 上 当 作 当前 的 状态 重复 这 个 
PE. RRL nextState 的 定义 如 下 : 

int nextState(s,a) { 图 3-66 表示 转换 表 的 数据 结构 


if ( check[base[s] + a] == s ) return nezt[basels] + a]; 
else return neziState(default[s], a); 





























a 
— 


} 

使 用 图 3- 66 中 所 示 数 据 结 构 的 目的 是 利用 状态 之 间 的 相似 性 来 缩短 next-check 数组 。 例 如 ， 
s 状态 的 默认 状态 1 可 能 是 一 个 “正在 处 理 一 个 标识 符 ” 的 状态 , 就 像 图 3-14 中 的 状态 10。 而 状态 
s 可 能 是 在 读 人 字母 th 之 后 进入 的 状态 。 这 里 th 既是 关键 字 then 的 一 个 前 缀 , 同时 也 可 能 是 
一 个 标识 符 的 词素 的 前 缀 。 当 输入 字符 为 es 时 , 我 们 必须 从 状态 s 到 达 一 个 特别 的 状态 。 该 状 
态 记 住 我 们 已 经 看 到 了 the; 当 输 入 字符 不 等 于 e 时 , RÆ s 的 动作 和 状态 上 的 动作 相同 。 因 此 ， 
我 们 将 check[ base[s] +e ] 的 值 设置 为 (以 确认 这 个 条 目 对 于 状态 s 有 效 )， 并 将 next 
[ base[ s] +e ] 的 值 置 为 前 面 提 到 的 特殊 状态 。 同 时 defouli[ s] 被 设置 为 i。 

虽然 我 们 可 能 无 法 选择 适当 的 base 值 , 使 next - check 的 所 有 条 目 都 被 充分 利用 。 经 验 表 明 ， 
采用 下 述 简单 策略 就 可 以 有 很 好 的 效果 : 按照 顺序 将 base 值 赋 给 各 个 状态 , 将 各 个 base[s] 的 值 
设置 为 最 小 的 、 能 够 使 得 状态 s 的 特殊 条 目的 位 置 都 尚未 被 占用 的 值 。 这 个 策略 需要 的 空间 只 比 
最 小 可 能 值 多 一 点 点 。 
3.9.9 3.9 节 的 练习 

练习 3. 9. 1: 扩展 图 3-58 中 的 表 , 使 得 它 包含 如 下 运算 符 : 

1)? 

2) + 

练习 3.9.2: 使 用 算法 3. 36 将 练习 3.7.3 中 的 正则 表达 式 直 接 转 换 成 DFA, 








O ”在 实践 中 可 能 还 有 另 -一 个 以 状态 为 下 标的 数组 ,如 果 某 个 状态 相关 的 动作 , 那么 这 个 数组 的 相应 元 素 会 指明 这 个 动作 。 


118 





! 练习 3. 9. 3: 我 们 只 需要 说 明 两 个 正则 表达 式 的 最 少 状态 DFA 同 构 , 就 可 以 证 明 这 两 个 正 
则 表达 式 等 价 。 使 用 这 种 方法 来 证 明 下 面 的 正则 表达 式 (alb)”,，(a"” 1b*)* 以 及 ((ela)b*)* 


! 练习 3. 9.4;: 为 下 列 的 正则 表达 式 构造 最 少 状 态 DFA: 

1) (alb) *a(alb) 

2) (alb) *aCalb)(alb) 

3) (alb) *aCalb)(alb) (alb) 

你 有 没有 看 出 什么 规律 ? 

LI 练习 3.9.5: 为 了 证 明 例 3. 25 中 非 正 式 给 出 的 结论 , 说 明正 则 表达 式 
(alb)*a(alb)(alb) … (alb) 

的 任何 DFA 至 少 具 有 2"” 个 状态 。 在 这 个 正则 表达 式 中 , (alb) 在 其 尾部 出 现 了 nm -1 次 。 提 

示 : 观察 练习 3.9.4 中 的 规律 。 各 个 状态 分 别 表示 了 关于 已 输入 串 的 哪些 信息 ? 


3. 10 


第 3 章 总 结 


:词法 单元 。 词 法 分 析 器 扫描 源 程序 并 输出 一 个 由 词法 单元 组 成 的 序列 。 这 些 词法 单元 通 


常会 逐个 传送 给 语法 分 析 器 。 有 些 词法 单元 只 包含 一 个 词法 单元 名 ,而 其 他 词法 单元 还 
有 一 个 关联 的 词法 值 , 它 给 出 了 在 输入 中 找到 的 这 个 词法 单元 的 某 个 实例 的 有 关 信息 。 

词素 。 每 次 词法 分 析 器 向 语法 分 析 器 返回 一 个 词法 单元 时 ,该 词法 单元 都 有 一 个 关联 的 
词素 , 即 该 词法 单元 所 代表 的 输入 字符 串 。 

缓冲 技术 。 为 了 判断 下 一 个 词素 在 何 处 结束 , 常常 需要 预先 扫描 输入 字符 。 因 此 , 词法 
分 析 器 往往 需要 对 输入 字符 进行 缓冲 。 可 以 使 用 两 个 技术 来 加 速 输入 扫描 过 程 : 循环 使 
用 一 对 缓冲 区 , 以 及 在 每 个 缓冲 区 末尾 放置 特殊 的 哨兵 标记 字符 。 该 字符 可 以 通知 词法 
分 析 器 已 经 到 达 了 缓冲 区 未 尾 。 

模式 。 每 个 词法 单元 都 有 一 个 模式 , 它 描述 了 什么 样 的 字符 序列 可 以 组 成 对 应 于 此 词法 
单元 的 词素 。 那 些 和 一 个 给 定 模式 匹配 的 字 ( 或 者 说 字符 串 ) 的 集合 称 为 该 模式 的 语言 。 

正则 表达 式 。 这 些 表达 式 常用 于 描述 模式 。 正 则 表达 式 是 从 单个 字符 开始 , 通过 并 、 连 
接 、Kleene 闭 包 、“ 重 复 多 次 "等 运算 符 构造 得 到 的 。 

正则 定义 。 多 个 语言 的 复杂 集合 ,比如 用 以 描述 一 个 程序 设计 语言 所 有 词法 单元 的 多 个 模式 党 
常 是 通过 正则 定义 来 描述 的 。 一 个 正则 定义 是 一 个 语句 序列 ,其 中 的 每 个 语句 定义 了 一 个 表 
示 某 正则 表达 式 的 变量 。 定 义 一 个 变量 的 正则 表达 式 时 可 以 使 用 已 经 定义 过 的 变量 。 

扩展 的 正则 表达 式 表示 法 。 为 了 使 正则 表达 式 更 易于 表达 模式 , 一些 附加 的 运算 符 可 以 
作为 缩写 在 正则 表达 式 中 使 用 。 比 如 + (一 个 或 多 个 )、? ( 零 个 或 一 个 ) 以 及 字符 类 (由 
特定 字符 集中 单个 字符 组 成 的 字符 串 的 集合 ) 。 

状态 转换 图 。 一 个 词法 分 析 器 的 行为 经 常 可 以 用 一 个 状态 转换 图 来 描述 。 它 有 多 个 状 
态 。 在 搜寻 可 能 与 某 个 模式 匹配 的 词素 的 过 程 中 , 各 个 状态 代表 了 已 读 和 人 字符 的 历史 信 
息 。 它 同时 具有 多 条 从 一 个 状态 到 达 另 一 个 状态 的 转换 (箭头 ) 。 每 个 转换 都 指明 了 下 一 
个 可 能 的 输入 字符 , 该 字 符 将 使 词法 分 析 器 改变 当前 状态 。 

有 穷 自动 机 。 它 是 状态 转换 图 的 形式 化 表示 。 它 指明 了 一 个 开始 状态 、 一 个 或 多 个 接受 
状态 ,以 及 状态 集 、 输入 字符 集 和 状态 间 的 转换 集合 。 接 受 状态 表明 已 经 发 现 了 和 某 个 
词法 单元 对 应 的 词素 。 与 状态 转换 图 不 同 , 有 穷 自动 机 既 可 以 在 输入 字符 上 执行 转换 ， 
也 可 以 在 空 输入 上 执行 转换 。 
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e 确定 有 穷 自动 机 。 一 个 确定 有 穷 自动 机 是 一 种 特殊 的 有 穷 自 动机 。 它 的 任何 一 个 状态 对 
于 任意 一 个 输入 符号 有 且 只 有 一 个 转换 。 同 时 它 不 允许 在 空 输入 上 的 转换 。 确 定 有 穷 自 
动机 类 似 于 状态 转换 图 , 对 它 的 模拟 相对 容易 , 央 此 适 于 作为 词法 分 析 器 的 实现 基础 。 

e 不 确定 有 穷 自 动机 。 不 是 确定 有 穷 自 动机 的 月 动机 称 为 不 确定 的 。NFA 通常 要 比 确定 有 
穷 自动 机 更 容易 设计 。 词 法 分 析 器 的 男 一 种 体系 结构 如 下 : 对 应 于 各 个 可 能 模式 都 有 一 
个 NFA, 并 且 我 们 使 用 表格 来 记录 这 些 NPA 在 扫描 输入 字符 时 可 能 进入 的 所 有 状态 。 

o 模式 表示 方法 之 间 的 转换 。 我 们 可 以 把 任意 一 个 正则 表达 式 转换 为 一 个 大 小 基本 相同 的 
NFA, 这 个 NFA 识别 的 语言 和 该 正则 表达 式 识别 的 相同 。 更 进一步 , 任何 NFA 都 可 以 转 
换 为 一 个 代表 相同 模式 的 DFA, 虽然 在 最 坏 的 情况 下 自动 机 的 大 小 会 以 指数 级 增长 , 但 
是 在 常见 的 程序 设计 语言 中 尚未 磁 到 这 些 情况 。 可 以 将 任意 一 个 确定 或 不 确定 有 穷 自动 
机 转化 为 一 个 正则 表达 式 , 使 得 该 表达 式 定义 的 语言 和 这 个 自动 机 识别 的 语言 相同 。 

© Lex。 有 一 系列 的 软件 系统 , 包括 Lex 和 Flex, 可 以 作为 生成 词法 分 析 器 的 工具 。 用 户 通 
过 扩展 的 正则 表达 式 来 描述 各 种 词法 单元 的 模式 。Lex 将 这 些 表 达 式 转化 为 词法 分 析 器 。 

” ”这 个 分 析 器 实质 上 是 一 个 可 以 识别 所 有 模式 的 确定 有 穷 自动 机 。 

e 有 穷 自动 机 的 最 小 化 。 对 于 每 一 个 DFA, 都 存在 一 个 接受 同样 语言 的 最 少 状态 DFA. AML 
如 此 , 一 个 给 定语 言 的 最 少 状 态 DFA( 不 计 同 构 ) 是 唯一 的 。 


3.11 第 3 章 参 考 文献 
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种 描述 神经 活动 的 有 穷 自 动机 模型 ,而 Kleene 的 兴趣 就 是 描述 那些 可 以 用 这 些 模型 表示 的 事件 。 
从 那 以 后 , 正则 表达 式 和 有 穷 自 动机 在 计算 机 科学 中 得 到 了 广泛 应 用 。 

各 种 各 样 的 正则 表达 式 已 经 应 用 于 很 多 流行 的 UNIX 工具 中 , 比如 awk ed, egrep, grep, lex, 
sed, sh 和 vi 等 。 可 移动 操作 系统 接口 (Portable Operating System Interface, POSIX) 的 标准 文档 
IEEE 1003 $I ISO/IEC 9945 中 定义 了 POSIX 扩展 正则 表达 式 , 它们 和 最 初 的 UNIX 正则 表达 式 非 
常 相 近 ， 只 有 少量 例外 ， 比 如 字符 类 的 助 记 表示 方式 。 许 多 脚本 语言 , 像 Perl、Python 和 Tcl, 都 
采用 了 正则 表达 式 , 但 常常 使 用 不 兼容 的 扩展 表示 方式 。 

我 们 熟悉 的 有 穷 自 动机 模型 和 算法 3. 39 中 的 有 穷 自动 机 最 小 化 方法 由 Huffman[ 6 ] 和 Moore 
[14] 给 出 。 而 Rabin 和 Scott[ 15] 最 先 提出 了 不 确定 有 穷 自动 机 的 概念 ,他 们 还 给 出 了 子 集 构造 
法 , 即 算法 3.29。 这 个 算法 证 明了 确定 自动 机 和 不 确定 自动 机 在 语言 识别 能 力 上 是 等 价 的 。 

McNaughton 和 Yamada[ 13 ] 最 先 给 出 了 一 个 利用 正则 表达 式 直 接 构 造 DFA 的 算法 。3. 9 节 中 
描述 的 算法 3. 36 最 早 被 Aho 用 于 构建 UNIX 正则 表达 式 匹 配 工具 egrep, 这 个 算法 还 被 应 用 于 
awk[3] 中 的 正则 表达 式 模 式 匹配 例 程 。 将 不 确定 自动 机 用 作 中 间 表 示 的 匹配 方法 首先 由 
Thompson[ 17 ] 提出。 该 文 还 提出 了 直接 模拟 NFA 的 算法 (算法 3. 22) 。 这 个 算法 被 Thompson 用 
于 文本 编辑 器 QED 中 。 

Lesk 开发 了 Lex 的 第 一 个 版 本 ,随后 Lesk 和 Schmidt 用 算法 3. 36 编写 了 Lex 的 第 二 个 版 本 
[10] 。 此 后 出 现 了 Lex 的 很 多 变 体 。GNU 版 本 的 Flex 及 其 文档 可 以 在 [4] 下 载 。 流 行 的 Lex 的 
Java 版 本 包括 JElex[7] 和 JLex[8]。 

在 3.4 节 的 练习 3.4.3 之 前 讨论 的 KMP 算法 来 自 [ 11] 。 可 处 理 多 个 关键 字 的 此 算法 的 扩展 
版 本 可 以 在 [2] 中 找到 。Aho 在 UNIX 工具 fgrep 的 第 一 个 实现 中 使 用 了 这 个 算法 。 

在 [5] 中 完整 地 介绍 了 有 关 有 穷 自动 机 和 正则 表达 式 的 理论 , 而 [1] 给 出 了 字符 串 匹 配 技术 
的 概述 。 
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第 4 章 语法 分 析 


本 章 介绍 的 语法 分 析 方 法 通常 用 于 编译 器 中 。 我 们 首先 介绍 基本 概念 , 然后 介绍 适合 手工 
实现 的 技术 , 最 后 介绍 用 于 自动 化 工具 的 算法 。 央 为 源 程 序 可 能 包含 语法 错误 ,所 以 我 们 还 将 讨 
论 如 何 扩展 语法 分 析 方 法 ,以 便 从 常见 错误 中 恢复 。 

在 设计 语言 时 , 每 种 程序 设计 语言 都 有 一 组 精确 的 规则 来 描述 良 构 (well-formed ) 程序 的 请 法 
结构 。 比 如 , 在 C 语言 中 ,一 个 程序 由 多 个 函数 组 成 ,一 个 函数 由 声明 和 语句 组 成 ,一 个 语句 由 
表达 式 组 成 , 等 等 。 程 序 设计 语言 构造 的 语法 可 以 使 用 2. 2 节 中 介绍 的 上 下 文 无 关 文法 或 者 BNF 
( 巴 库 斯 - 责 尔 范式 ) 表 示 法 来 描述 。 文 法 为 语言 设计 者 和 编译 器 编写 者 都 提供 了 很 大 的 便利 。 

e 文法 给 出 了 一 个 程序 设计 语言 的 精确 易 懂 的 语法 规约 。 

o 对 于 某 些 类 型 的 文法 ， 我 们 可 以 自动 地 构造 出 高 效 的 语法 分 析 器 ， 它 能 够 确定 一 个 源 程序 

、， 的 语法 结构 。 同 时 ,语法 分 析 器 的 构造 过 程 可 以 揭示 出 语法 的 二 义 性 , 同时 还 可 能 发 现 一 

些 容易 在 语言 的 初始 设计 阶段 被 忽略 的 问题 。 

e 一 个 正确 设计 的 文法 给 出 了 一 -个 语言 的 结构 。 该 结构 有 助 于 把 源 程序 翻译 为 正确 的 目标 

代码 , 也 有 助 于 检测 错误 。 

© 一 个 文法 支持 逐步 加 和 可 以 完成 新 任务 的 新 语言 构造 从 而 选 代 地 演化 和 开发 语言 。 如 果 

对 语言 的 实现 遵循 语言 的 文法 结构 ,那么 在 实现 中 加 入 这 些 新 构造 的 工作 就 变 得 更 加 
容易 。 


4.1 引 论 


在 本 节 中 , 我 们 将 探讨 语法 分 析 器 是 如 何 集成 到 一 个 典型 的 编译 器 中 的 。 然 后 我 们 将 研究 
算术 表达 式 的 典型 文法 。 通 过 表达 式 文法 已 经 足以 说 明 请 法 分 析 的 本 质 , 因为 处 理 表 达 式 的 语 
法 分 析 技 术 可 以 用 于 处 理 程序 设计 语言 的 大 部 分 构造 。 这 一 节 的 最 后 将 讨论 错误 处 理 的 问题 ， 
因为 当 语 法 分 析 器 发 现 它 的 输入 不 能 由 它 的 文法 生成 时 , 它 必须 作出 适当 的 反应 。 

4.1.1 语法 分 析 器 的 作用 

在 我 们 的 编译 器 模型 中 , 语法 分 析 器 从 词法 分 析 器 获得 一 个 由 词法 单元 组 成 的 串 , 并 验证 这 
个 串 可 以 由 源 语 言 的 文法 生成 , 如 图 4-1 所 示 。 我 们 期 望 语法 分 析 器 能 够 以 易于 理解 的 方式 报告 
语法 错误 , 并 且 能 够 从 常见 的 错误 中 恢复 并 继续 处 理 程 序 的 其 余部 分 。 从 概念 上 讲 , 对 于 良 构 的 
EF, 语法 分 析 器 构造 出 一 棵 语法 分 析 树 , 并 把 它 传递 给 编译 器 的 其 他 部 分 进一步 处 理 。 实 际 
上 ,并 不 需要 显 式 地 构造 出 这 棵 语法 分 析 树 ， 因 为 正如 我 们 将 看 到 的 , 对 源 程序 的 检查 和 翻译 动 
作 可 以 和 语法 分 析 过 程 交 错 完成 。 因 此 , 语法 分 析 器 和 前 端的 其 他 部 分 可 以 用 一 个 模块 来 实现 。 

处 理 文法 的 语法 分 析 器 大 体 上 可 以 分 为 三 种 类 型 : 通用 的 、 自 顶 向 下 的 和 自 底 向 上 的 。 像 
Cocke-Younger-Kasami 算法 和 Earley 算法 这 样 的 通用 语法 分 析 方 法 可 以 对 任意 文法 进行 语法 分 析 
〈《 见 参考 文献 ) RT, 这 些 通用 方法 效率 很 低 , 不 能 用 于 编译 器 产品 。 

编译 器 中 常用 的 方法 可 以 分 为 自 顶 向 下 的 和 自 底 向 上 的 。 顾 名 思 义 ,， 自 顶 向 下 的 方法 从 语 
法 分 析 树 的 顶部 ( 根 结 点 ) 开 始 向 底部 (叶子 结 点 ) 构 造 语法 分 析 树 , 而 自 底 向 上 的 方法 则 从 叶子 
结 点 开始 , 逐渐 向 根 结 点 方向 构造 。 这 两 种 分 析 方法 中 , 语法 分 析 器 的 输入 总 是 按照 从 左 向 右 的 
方式 被 扫描 , 每 次 扫描 一 个 符号 。 
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图 4-1 ”编译 器 模型 中 语法 分 析 器 的 位 置 


LL 和 LR 文法 ,其 表达 能 力 已 经 足以 描述 现代 程序 设计 语言 的 大 部 分 语法 构造 了 。 手 工 实现 的 
语法 分 析 器 通常 使 用 LL 文法 。 比 如 , 2.4. 2 节 中 的 预测 语法 分 析 方法 能 够 处 理 LL 文法 。 处 理 较 
大 的 LR 文法 类 的 语法 分 析 器 通常 是 使 用 自动 化 工具 构造 得 到 的 。 
在 本 章 中 , 我 们 假设 语法 分 析 器 的 输出 是 语法 分 析 树 的 某 种 表示 形式 。 该 语法 分 析 树 对 应 
于 来 自 词法 分 析 器 的 词法 单元 流 。 在 实践 中 , 语法 分 析 过 程 中 可 能 包括 多 个 任务 , 比如 将 不 同 词 
法 单元 的 信息 收集 到 符号 表 中 ， 进行 类 型 检查 和 其 他 类 型 的 语义 分 析 ， 以 及 生成 中 间 代 码 。 我 们 
oy SABIE 4-1 中 的 “前 端的 其 余部 分 ”里 面 。 在 后 纺 几 章 中 将 详细 讨论 这 些 
沪 动 。 
4.1.2 代表 性 的 文法 
为 了 便于 参考 , 我 们 先 给 出 一 些 即将 在 本 章 中 加 以 研究 的 文法 。 对 那些 以 while 或 int 这 样 
的 关键 字 开 头 的 构造 进行 语法 分 析 相 对 容易 ， 因 为 关键 字 可 以 引导 我 们 选择 适当 的 文法 产生 式 
守 输入。 因此 我 们 主要 关注 表达 式 。 因 为 运算 符 的 结合 性 和 优先 级 去 达 式 的 处 理 更 具 朱 
下 面 的 文法 指明 了 运算 符 的 结合 性 和 优先 级 。 这 个 文法 和 我 们 在 第 2 章 中 使 用 的 描述 表达 
式 、 项 和 因子 的 文法 类 似 。E 表示 一 组 以 + 号 分 隔 的 项 所 组 成 的 表达 式 ; 了 表示 由 一 组 以 * 号 分 
胎 的 因子 所 组 成 的 项 ; 而 下 表示 因子 , 它 可 能 是 括号 括 起 的 表达 式 , 也 可 能 是 标识 符 : 
EE+TIT 
TE TxF|IF (4.1) 
F-+(E) | id 
表达 式 文法 (4.1) 属 于 LR 文法 类 , 适用 于 自 底 向 上 的 语法 分 析 技 术 。 这 个 文法 经 过 修改 可 以 处 
e AREER. RH. CREAT ATM TORR, BEEZ 
下 面 给 出 表达 式 文法 (4. 1) 的 无 左 递归 版 本 , 该 版 本 将 被 用 于 自 顶 向 下 的 语法 分 析 : 
E-TE' 
E's + TE'le 
T—=FT' (4.2) 
T'—x* FT le 
F—( E ) | id 
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这 里 的 表示 各 种 类 型 的 表达 式 。 文 法 (4.3) 人 允许 一 个 表达 式 , 比如 a t+bec, 具有 多 棵 语法 分 
析 树 。 
4.1.3 语法 错误 的 处 理 
本 节 的 其 余部 分 将 考虑 语法 错误 的 本 质 以 及 错误 恢复 的 一 般 策略 。 其 中 的 两 种 策略 分 别称 
为 丽 慌 模式 和 短语 层次 恢复 。 它 们 将 和 特定 的 语法 分 析 方 法 一 起 详细 讨论 。 
如 果 编 译 器 只 处 理 正确 的 程序 , 那么 它 的 设计 和 实现 将 会 大 大 简化 。 但 是 ， 人 们 还 期 望 编译 
器 能 够 帮助 程序 员 定位 和 跟踪 错误 。 因 为 不 管 程序 员 如 何 努 力 , 程序 中 难免 会 有 错误 。 令 人 惊 
奇 的 是 , 虽然 错误 如 此 常见 , 但 很 少 有 语言 在 设计 的 时 候 就 考虑 到 错误 处 理 问题 。 如 果 我 们 的 口 
语 也 像 计算 机 语言 那样 对 语法 精确 性 有 要 求 , 那么 我 们 的 文明 就 会 大 不 相同 。 大 部 分 程序 设计 
语言 的 规范 没有 规定 编译 器 应 该 如 果 处 理 错 误 ; 错误 处 理 方法 由 编译 器 的 设计 者 决定 。 从 一 开 
始 就 计划 好 如 何 进 行 错误 处 理 不 仅 可 以 简化 编译 器 的 结构 , 还 可 以 改进 错误 处 理 方法 。 
程序 可 能 有 不 同 层 次 的 错误 。 
e 词法 错误 , 包括 标识 符 、 关 键 字 或 运算 符 拼 写 错误 (比如 把 标识 符 ellipseSize 写成 
elipseSize) 和 没有 在 字符 串 文本 上 正确 地 加 上 引号 。 
e 语法 错误 , 包括 分 号 放 错 地 方 、 花 括号 , AD “(aR “| ,多余 或 缺失 。 另 一 个 C 语言 或 
Java 语 言 中 的 语法 错误 的 例子 是 一 个 case 语句 的 外 围 没 有 相应 的 switch 语句 (然而 ， 
语法 分 析 器 通常 允许 这 种 情况 出 现 ， 当 编译 器 在 之 后 要 生成 代码 时 才 会 发 现 这 个 错误 ) 。 
CER, 包括 运算 符 和 运算 分 量 之 则 的 类 型 不 匹配 。 例 如 ,返回 类 型 为 void 的 某 个 
Java 方 法 中 出 现 了 一 个 返回 某 个 值 的 return 语句 。 
o 逻辑 错误 ,可 以 是 因 程 序 员 的 错误 推理 而 引起 的 任何 错误 。 比 如 在 一 个 C 程序 中 应 该 使 
用 比较 运算 符 == 的 地 方 使 用 了 赋值 运算 符 = 。 这 样 的 程序 可 能 是 良 构 的 , 但 是 却 没 有 正 
确 反 映 出 程序 员 的 意图 。 
语法 分 析 方 法 的 精确 性 使 得 我 们 可 以 非常 高 效 地 检测 出 语法 错误 。 有 些 语法 分 析 方 法 , 比 
如 LL 和 LR 方法 , 能 够 在 第 一 时 间 发 现 错误 。 也 就 是 说 ,， 当 来 自 词 法 分 析 器 的 词法 单元 流 不 能 根 
据 该 语言 的 文法 进一步 分 析 时 就 会 发 现 错误 。 更 精确 地 讲 , 它们 具有 可 行 前 组 特性 (viable-prefix 
property) ， 也 就 是 说 , 一 旦 它们 发 现 输入 的 某 个 前 缀 不 能 够 通过 添加 一 些 符号 而 形成 这 个 语言 航 
串 ， 就 可 以 立刻 检测 到 语法 错误 。 l 
要 重视 错误 恢复 的 另 一 个 原因 是 ,不 管 产 生 错误 的 原因 是 什么 , 很 多 错误 都 以 语法 错误 的 方 
式 出 现 , 并 且 在 不 能 继续 进行 语法 分 析 时 暴露 出 来 。 有 些 语 义 错误 (比如 类 型 不 匹配 ) 也 可 以 被 
高 效 地 检测 到 。 然 而 , 总 的 来 说 , 在 编译 时 精确 地 检测 出 语义 错误 和 逻辑 错误 是 很 困难 的 。 
语法 分 析 器 中 的 错误 处 理 程 序 的 目标 说 起 来 很 简单 , 但 实现 起 来 却 很 有 挑战 性 : 
© 清晰 精确 地 报告 出 现 的 错误 。 l 
o 能 很 快 地 从 各 个 错误 中 恢复 ,以 继续 检测 后 面 的 错误 。 
o 尽 可 能 少 地 增加 处 理 正确 程序 时 的 开销 。 
幸运 的 是 , 常见 的 错误 都 很 简单 ,使 用 相对 直接 的 错误 处 理 机 制 就 足以 达到 目标 。 
”一 个 错误 处 理 程 序 应 该 如 何 报告 出 现 的 错误 ? 至少, 它 必 须 报告 在 源 程 序 的 什么 位 置 检测 
到 铺 误 ， 因 为 实际 的 错误 很 可 能 就 出 现在 这 个 位 置 之 前 的 几 个 词法 单元 处 。 一 个 常用 的 策略 是 
打印 出 有 问题 的 那 一 行 , 然后 用 一 个 指针 指向 检测 到 错误 的 地 方 。 
4.1.4 错误 恢复 策略 
当 检 测 到 一 个 错误 时 , 语法 分 析 器 应 该 如 何 恢复 ? 虽然 还 没有 哪个 策略 能 够 证 明 自己 是 被 
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普遍 接受 的 , 但 有 一 些 方 法 的 适用 范围 很 广 。 最 简单 的 方法 是 让 语法 分 析 器 在 检测 到 第 一 个 错 
误 时 给 出 错误 提示 信息 , 然后 退出 。 如 果 语 法 分 析 器 能 够 把 自己 恢复 到 某 个 状态 , 且 有 理由 预期 
从 那里 开始 继续 处 理 输入 将 提供 有 意义 的 诊断 信息 , 那么 它 通 常会 发 现 更 多 的 错误 。 如 果 错 误 
KE, 那么 最 好 让 编译 器 在 超过 某 个 错误 数量 上 界 之 后 停止 分 析 。 这 样 做 要 比 让 编译 器 产生 大 
和 量 恼人 的 “可 疑 ”错误 信息 更 好 。 

恐慌 模式 的 恢复 

使 用 这 个 方法 时 , 语法 分 析 器 一 旦 发 现 错 误 就 不 断 丢 弃 输 入 中 的 符号 , 一 次 丢弃 一 个 符号 ， 
直到 找到 同步 词法 单元 (synchronizing token) 集合 中 的 某 个 元 素 为 止 。 同 步 词 法 单元 通常 是 界限 
符 ， 比 如 分 号 或 者 | 。 它 们 在 源 程 序 中 的 作用 是 清晰 、 无 二 义 的 。 编 译 器 的 设计 者 必须 为 源 语言 
选择 适当 的 同步 词法 单元 。 恺 慌 模 式 的 错误 纠正 方法 常常 会 跳 过 大 景 输入 , 不 检查 被 跳 过 部 分 
的 其 他 错误 。 但 是 它 很 简单 ， 并且 能 够 保证 不 会 进入 无 限 循环 。 我 们 稍 后 考虑 的 某 些 方法 则 不 
一 定 能 保证 不 进入 无 限 循环 。 

短语 层次 的 恢复 

当 发 现 一 个 错误 时 , 语法 分 析 器 可 以 在 余下 的 输入 上 进行 局 部 性 纠正 。 也 就 是 说 , 它 可 能 将 
余下 输入 的 某 个 前 缀 蔡 换 为 男 一 个 串 , 使 语法 分 析 器 可 以 继续 分 析 常用 的 局 部 纠正 方法 包括 
将 一 个 逗号 替换 为 分 号 、 删 除 一 个 多 余 的 分 号 或 者 插 人 一 个 遗漏 的 分 号 。 如 何 选 择 局 部 纠正 方 
法 是 由 编译 器 设计 者 决定 的 。 当 然 , 我 们 必须 小 心 选 择 蔡 换 方法 ,以 避免 进入 无 限 循 环 。 比 如 ， 
如 果 我 们 总 是 在 当前 输入 符号 之 前 插 人 符号 ， 就 会 出 现 无 限 循环 。 

短语 层次 替换 方法 已 经 在 多 个 错误 修复 型 编译 器 中 使 用 , 它 可 以 纠正 任何 输入 串 。 它 主要 





的 不 足 在 于 它 难 以 处 理 实际 错误 发 生 在 被 检测 位 置 之 前 的 情况 。 
错误 产生 式 


通过 预测 可 能 遇 到 的 常见 错误 , 我 们 可 以 在 当前 语言 的 文法 中 加 入 特殊 的 产生 式 。 这 些 产 
生 式 能 够 产生 含有 错误 的 构造 ,从 而 基于 增加 了 错误 产生 式 的 文法 构造 得 到 一 个 语法 分 析 器 。 如 
果 语 法 分 析 过 程 中 使 用 了 某 个 错误 产生 式 , 语法 分 析 器 就 检测 到 了 一 个 预期 的 错误 。 语 法 分 析 
器 能 够 据 此 生成 适当 的 错误 诊断 信息 , 指出 在 输入 中 识别 出 的 错误 构造 。 

全 局 纠正 

在 理想 情况 下 , 我 们 希望 编译 器 在 处 理 一 个 错误 输入 捉 时 通过 最 少 的 改动 将 其 转化 为 语法 
正确 的 串 。 有 些 算法 可 以 选择 一 个 最 小 的 改动 序列 , 得 到 开销 最 低 的 全 局 性 纠正 方法 。 给 定 一 
个 不 正确 的 输入 x 和 文法 C, 这 些 算法 将 找 出 一 个 相关 串 y 的 语法 分 析 树 , 使 得 将 x 转换 为 y 所 
需要 的 插入、 删除 和 改变 的 词法 单元 的 数量 最 少 。 遗 憾 的 是 ,从 时 间 和 空间 的 角度 看 ,实现 这 些 
方法 一 般 来 说 开销 太 大 , 因此 这 些 技术 当前 仅 具 有 理论 价值 。 

请 注意 , 一 个 最 接近 正确 的 程序 可 能 并 不 是 程序 员 想 要 的 程序 。 不 管 怎样 , 最低 开销 纠正 的 
概念 仍然 提供 了 一 个 可 用 于 评价 错误 恢复 技术 的 指标 , 并 已 经 用 于 为 短语 层次 的 恢复 寻找 最 佳 
PRA, 

4.2 上 下 文 无 关 文 法 

2.2 节 中 已 经 介绍 了 文法 的 概念 。 在 那里 , 它 用 于 系统 地 摘 述 程序 设计 语言 的 构造 ( 比如 表 

达 式 和 语句 ) 的 语法 。 下 面 的 产生 式 使 用 语法 变量 seme 来 表示 请 句 , 使 用 变量 expr 表示 表达 式 。 

stmt->if (expr) stmt else stmt (4. 4) 2 
上 述 产生 式 描 述 了 这 种 形式 的 条 件 语句 的 结构 。 其 他 产生 式 则 精确 地 定义 了 expr 是 什么 , UR 
stmt 可 以 是 什么 。 l 
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jo AS DALIT LB SCTE EY RE SL ANAT EE HH De SP ATR ORIN BE HB 9 SR 
特别 地 , 推导 的 概念 在 讨论 产生 式 在 分 析 过 程 中 的 应 册 顺 序 时 非常 有 用 。 
4.2.1 上 下 文 无 关 文 法 的 正式 定义 

根据 2. 2 节 的 介绍 可 知 , 一 个 上 下 文 无 关 文 法 (简称 文法 ) 由 终结 符号 、 非 终结 符号 、 一 个 开 
始 符 号 和 一 组 产生 式 组 成 。 

1) 终结 符号 是 组 成 串 的 基本 符号 。 术 话 “ 词 法 单元 名 字 ” 是 “终结 符号 ”的 同义词 。 当 我 
们 讨论 的 显然 是 词法 单元 的 名 字 时 , 我 们 经 常 使 用 “词法 单元 ”这 个 词 来 指称 终结 符号 。 我 们 假 
设 终结 符号 是 词法 分 析 器 输出 的 词法 单元 的 第 一 个 分 量 。 在 (4.4) 中 , 终结 符号 是 关键 字 if A 
else 以 及 符号 “(“ 和 ”)”。 

2) 非 终 结 符号 是 表示 串 的 集合 的 语法 变量 。 在 (4.4) 中 , stmt 和 expr 是 非 终结 符号 。 非 终结 
符号 表示 的 串 集 合用 于 定义 由 文法 生成 的 语言 。 非 终结 符号 给 出 了 语言 的 层次 结构 ,而 这 种 层 
次 结构 是 语法 分 析 和 翻译 的 关键 。 

3) 在 一 个 文法 中 , 某 个 非 终结 符号 被 指定 为 开始 符号 。 这 个 符号 表示 的 串 集 合 就 是 这 个 文 
法 生成 的 语言 。 按 照 惯例 , 首先 列 出 开始 符号 的 产生 式 。 

4) 一 个 文法 的 产生 式 描述 了 将 终结 符号 和 非 终 结 符号 组 合成 串 的 方法 。 每 个 产生 式 由 下 列 
TRAR: 

@ 一 个 被 称 为 产生 式 头 或 去 部 的 非 终结 符号 。 这 个 产后 式 定 义 了 这 个 头 所 代表 的 溃 集 合 的 
一 部 分 。 

@) 符号 一 。 有 时 也 使 用 :: = 来 蔡 代 箭头 。 

@ 一 个 直 零 个 或 多 个 终结 符号 与 非 终结 符号 组 成 的 产生 式 体 或 右 部 。 产 生 式 体 中 的 成 分 描 
述 了 产生 式 头 上 的 非 终 结 符 号 所 对 应 的 串 的 某 种 构造 方法 。 




















图 4-2 中 的 文法 定义 了 简单 的 算术 表达 式 。 在 这 ezpression — expression + term 
y -E ezpression —> expression - term 
A 二 Apr EL A, 
| 文法 中 终结 符 号 是 expression — term 
id+-x* / ( ) term — term factor 
= z 3 . term — term / factor 
非 终结 符号 是 expression , term 和 factor, 而 expression 是 开始 符 term. “9° faétor 
号 ， factor — ( expression ) 
factor > id 











4.2.2 符号 表示 的 约定 

为 了 避免 总 是 声明 “这 些 是 终结 符号 ”,“ 这 些 是 非 终 “图 42 简单 算术 表达 式 的 文法 
BS”, 等 等 , 在 本 书 的 其 余部 分 将 对 文法 符号 的 表示 使 用 以 下 约定 。 

1) 下 述 符号 是 终结 符号 : 

O 在 字母 表 里 排 在 前 面 的 小 写字 母 , HEA a, b, co 

O 运算 符号 , 比如 + 、* 等。 

@ WARS, MNES ESF, 

@ 数字 0、1、…、9。 

© RAFFE, Ei id 或 这。 每 个 这 样 的 字符 捉 表示 一 个 终结 符号 。 

2) 下 述 符 号 是 非 终结 符号 : 

© 在 字母 表 中 排 在 前 面 的 大 写字 母 , AA, B, Co 

© 字母 5。 它 出 现时 通常 表示 开始 符号 。 

@ 小 写 、 和 斜体 的 名 字 ， 比 如 expr 或 simto 

当 讨论 程序 设计 语言 的 构造 时 , 大写 字母 可 以 用 于 表示 代表 程序 构造 的 非 终 结 符号 。 比 
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如 , 表达 式 、 项 利 因子 的 非 终 结 符号 通常 分 别 用 已 .下 和 到 表示 。 
3) 在 字母 表 中 排 在 后 面 的 大 写字 母 (比如 下 Y、Z) 表示 文法 符号 。 也 就 是 说 ,表示 非 终结 
符号 或 终结 符号 。 
4) 在 字母 表 中 排 在 后 面 的 小 写字 母 (主要 是 x、v、…、z) 表示 (可 能 为 空 的 ) 终 结 符号 串 。 
5) 小 写 的 希腊 字母 ,比如 a、B、y, 表示 (可 能 为 空 的 ) 文 法 符号 举 。 因 此 , 一 个 普通 的 产生 
式 可 以 写作 Aa, 其 中 4 是 产生 式 的 头 ,a 是 产生 式 的 体 。 
6) 共有 相同 的 头 的 一 组 产生 式 Asay, Aa), +, Aoa (A FER) TUBE Aa lay | 
lalo Bete Gy, Or, 0, QL. BRE A 的 不 同 可 选 体 。 
7) 除非 特别 说 明 , 第 一 个 产生 式 的 头 就 是 开始 符号 。 
按照 这 些 约定 , 例子 4.5 的 文法 可 以 改 为 如 下 更 加 简单 的 形式 : 
EE +TIE-TI7 
ToT « FIT/FIF 
F-( E) | id 
上 上面 的 符号 表示 约定 告诉 我 们 BT 入 是 非 终结 符号 , 其 中 是 开始 符号 。 其 余 的 符号 是 终结 
符号 。 l 口 
4.2.3 推导 
将 产生 式 看 作 重 写 规则 , 就 可 以 从 推导 的 角度 精确 地 描述 构造 语法 分 析 树 的 方法 。 从 开始 
符号 出 发 , 每 个 重 写 步 又 把 一 个 非 终结 符号 蔡 换 为 它 的 某 个 产生 式 的 体 。 这 个 推导 思想 对 应 于 
目 顶 向 下 构造 语法 分 析 树 的 过 程 ,但 是 推导 概念 所 给 出 的 精确 性 在 讨论 自 底 向 上 的 语法 分 析 过 
程 时 尤其 有 用 。 正 如 我 们 将 看 到 的 ， 自 底 向 上 语法 分 析 和 一 种 被 称 为 “最 右 ” 推 导 的 推导 类 型 相 
关 。 在 这 种 推导 过 程 中 , 每 -- 步 重 写 的 都 是 最 右边 的 非 终结 符 号 。 | 
比如 , 考虑 下 列 只 有 一 个 非 终 结 符号 E 的 文法 。 它 在 文法 (4.3) 中 增加 了 一 个 产生 
E> -EF; 








EsE+E\E*xE\|-E\(E) \id (4.7) 
FER -EE 表明 ,如 果 表 示 一 个 表达 式 , MA — EWR ER — ARER. HE HR 
为 -的 过 程 写作 

E> -E 
ERIRE “CE HES - E” o ER E( E ) 可 以 将 任何 文法 符号 串 中 出 现 的 E 的 任何 实例 蔡 换 
ACE). teil, E + E> (E) * ERE * ESE * (E), 我们 可 以 按照 任意 顺序 对 单个 不 
断 地 应 用 各 个 产生 式 , 得 到 一 个 替换 的 序列 。 比 如 ; 
E> -E> -( E)» - (id ) 

FATHER 1 AE BF FAG WB) — (id ) 的 推导 。 这 个 推导 证 明了 串 - (id ) 是 表达 式 的 一 
个 实例 。 


和 有 是 任意 的 文法 符号 串 。 假 设 4 一 y 是 一 个 产生 式 。 那 么 我 们 写作 adB 一 ay6。 符 号 二 表示 
“通过 一 步 推导 出 ”。 当 一 个 推导 序列 wm apa, 将 mg 替换 为 m ,我 们 说 a 推导 出 ou。 
我 们 经 党 说 “经 过 和 零 步 或 多 步 推导 出 ”, 我 们 可 以 使 用 符号 己 来 表示 这 种 关系 。 因 此 ， 

1) 对 于 任何 串 a, a Se, 并 且 

2) MR e S8 H pay, 那么 a Sys 

AW, SRK "AU ARE EES” , 
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MRS >a, 其 中 3$ 是 文法 C 的 开始 符号 , 我 们 说 w 是 6 的 一 个 名 型 (sentential form). TAYE 
意 , 一 个 句 型 可 能 婚 包 含 终结 符号 又 包含 非 终结 符 苇 ,也 可 能 是 空 串 。 文 法 6 的 一 个 句子 (sen- 
tence) 是 不 包含 非 终结 符号 的 句 型。 一 个 文法 生成 的 语言 是 它 的 所 有 和 句子 的 集合 。 因 此 ,一 个 终 
结 符号 串 w 在 6 生成 的 语言 L(G) 中 ， 当 且 仅 当 w 是 6 的 一 个 句子 (或 者 说 5 Sw). ALAR CH 
生成 的 语言 被 称 为 上 下 文 无 关 语 言 ( context-free language ) 。 如 果 两 个 文法 生成 相同 语言 ， 这 商 个 
文法 就 被 称 为 是 等 价 的 。 
HB — (id +id) 是 文法 (4.7) 的 一 个 句子, 因为 存在 一 个 推导 过 程 
E>- E>- (E)»- (E +E)»s-(id+E)»s-(id+id) (4.8) 
BE. -E, - (E), e, - (id + id) HERALA WN, RTA E>- (id +id ) 来 指明 
- (id + id ) 可 以 从 五 推导 得 到 。 
在 每 一 个 推导 步骤 上 都 需要 做 两 个 选择 。 我 们 要 选择 鞭 换 哪个 非 终 结 符号 , 并 且 在 做 出 这 
个 决定 之 后 , 还 必须 选择 一 个 以 此 非 终 结 符号 作为 头 的 产生 式 。 比 如 , 下 面 给 出 的 - (ia + id ) 
的 另 一 种 推导 和 推导 (4. 8 ) 在 最 后 两 步 有 所 不 同 : 
E>- ES- (E)»- (E+1E)S- (E+id)>-(id+id) (4.9) 
在 这 两 个 推导 中 , 每 个 非 终结 符号 都 被 蔡 换 为 同一 个 产生 式 体 ,但 替换 的 顺序 有 所 不 同 。 
为 了 理解 语法 分 析 器 是 如 何 工作 的 , 我 们 将 考虑 在 每 个 推导 步骤 中 按照 如 下 方式 选择 被 蔡 
换 的 非 终 结 符号 的 两 种 推导 过 程 : 
1) ÆR £42} (leftmost derivation) 中 ,总 是 选择 每 个 句 型 的 最 左 非 终结 符号 。 如 果 ap 是 一 
个 推导 步骤 , 且 被 替换 的 是 a 中 的 最 左 非 终结 符号 , 我 们 写作 a PB 
2) 在 最 右 推 导 (rightmost derivation) 中 ,总 是 选择 最 右边 的 非 终结 符号 ， 此 时 我 们 写作 a >f. 
推导 (4.8) 是 最 左 推导 , 因此 它 可 以 写成 
E>- E=>-(E)a- (E+ E)=- (id + E)=>- (id + id) 
请 注意 ,推导 (4.9) 是 一 个 最 右 推导 。 
根据 我 们 的 符号 表示 惯例 , 每 个 最 左 推导 步 又 都 可 以 写成 wAy =uôy, 其 中 w 只 包含 终结 符 
号 , 4 一 6 是 被 应 用 的 产生 式 , 而 y 是 一 个 文法 符号 串 。 为 了 强调 a 经 过 一 个 最 左 推导 过 程 得 到 
B, 我 们 写作 a Bo 如 果 S >a ,那么 我 们 说 a 是 当前 文法 的 最 左 句 型 (left-sentential form) 。 
对 于 最 右 推导 也 有 类 似 的 定义 。 最 右 推 导 有 时 也 称 为 规范 推导 (canonical derivation) 。 
4.2.4 语法 分 析 树 和 推导 
语法 分 析 树 是 推导 的 图 形 表示 形式 , 它 过 滤 掉 了 推导 过 程 中 对 非 终结 符号 应 用 产生 式 的 顺 
序 。 语 法 分 析 树 的 每 个 内 部 结 点 表示 一 个 产生 式 的 应 用 。 该 内 部 结 点 的 标号 是 此 产生 式 头 中 的 
非 终结 符号 4; 这 个 结 点 的 子 结 点 的 标号 从 左 到 右 组 成 了 在 推导 过 程 中 替换 这 个 4 的 产生 式 体 。 














比如 ,图 43 中 ,~ (id + 过 ) 的 语法 分 析 树 是 根据 推导 (4.8) 得 到 P. 

的 , 它 也 可 以 根据 推导 (4 9) 得 到 。 S £ 
ARARO PE AO ARS ET REARS, 也 可 以 是 es, 

EES. NACE HA AES BM LBB a, TR ZS 

的 结果 (yield) 或 边缘 (frontier) 。 io 
为 了 了 解 推导 和 语法 分 析 树 之 间 的 关系 , 考虑 任意 的 推导 ma 站 i 


=> o=ma,, HP a, 是 单个 非 终结 符号 4。 对 于 推导 中 的 每 个 名 型 oi, 我 网 43 -(id+ia) Ag 
们 可 以 构造 出 一 个 结果 为 a 的 语法 分 析 树 。 这 个 构造 过 程 是 对 i 的 一 次 语法 分 析 树 
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归纳 过 程 。 

基础 : al =A 的 语法 分 析 树 就 是 标号 为 4 的 单个 结 点 。 

归纳 步骤 : 假设 我 们 已 经 构造 出 了 -- 棵 结果 为 a = XiX…Xi 的 语法 分 析 树 (请 注意 ,按照 
我 们 的 符号 表示 约定 ， 每 个 文法 符号 总 可 以 是 非 终结 符号 ， 也 可 以 是 终结 符号 ) 。 假 设 w 是 将 
ai _i 中 的 某 个 非 终结 符号 艺 替换 为 B = Y Yy Yn 而 得 到 的 名 型 。 也 就 是 说 ,在 这 个 推导 的 第 ; 
步 中 ’ 对 ci 1 应 用 规则 AB, HES a; = X XQ KX; BX aX pe 

为 了 模拟 这 一 推导 步骤 , 我 们 在 当前 的 语法 分 析 树 中 找 出 左 起 第 j 个 非 < 叶 子 结 点 。 这 个 绩 
点 的 标号 为 XX。 向 这 个 叶子 结 点 添加 m 个 子 结 点 , 从 左边 开始 分 别 将 这 些 子 结 点 标号 为 Yi 、Y、 

、Y。 作 为 一 种 特殊 情况 , 如 果 m =0, IBA Bae, 我 们 给 第 j 个 叶子 结 点 加 上 一 个 标号 为 e 的 
子 结 点 。 l 
PO) 根据 推导 (4.8) 构造 得 到 的 语法 分 析 树 的 序列 显示 在 图 4-4 中 。 推 导 的 第 一 步 是 
B= - 瑟 。 为 了 模拟 这 一 步 , 我 们 将 标号 分 别 为 - 和 巨 的 两 个 子 结 点 加 到 第 一 棵 树 的 根 结 点 上， 
得 到 第 二 棵 语法 分 析 树 。 

这 个 推导 的 第 二 步 是 - k= - ( E), ME, 将 标号 分 别 为 ( .已 、) 的 三 个 子 结 点 加 到 第 二 
棵 树 中 标号 为 下 的 叶子 结 点 上 , 得 到 结果 为 - ( E ) 的 第 三 棵 树 。 按 照 这 个 方法 继续 下 去 ; 我 们 
就 得 到 了 完整 的 语法 分 析 树 ， 即 第 六 棵 树 。 o 

LO} A TERAN PS AOA RUE, 所 以 在 推导 和 语法 分 析 树 之 间 具 有 多 
对 一 的 关系 。 比 如 , 推导 (4.8) 和 (4.9) 都 和 图 4- 4 中 的 最 后 一 棵 语法 分 析 树 关联 。 














E => E => E 
Z YN xe OS 
e E ~ E 
ZEN 
( E` 
= E E 
AIN e A e S 
ZIN ZTN We 
( ( E`) E 
rai praia AIN 
E + E + E E + E 
l i id 


图 4-4 推导 (4.8) 的 语法 分 析 树 序列 


因为 在 语法 分 析 树 和 最 左 推 导 /最 右 推导 之 间 存 在 一 对 一 的 关系 ,所 以 在 接 下 来 的 内 容 中 ， 
我 们 将 频繁 地 通过 构造 最 左 推导 或 最 厂 推 导 来 进行 语法 分 析 。 最 左 或 最 右 推导 都 以 一 种 特定 的 
顺序 来 蔡 换 句 型 中 的 符号 ,因此 它们 也 过 滤 掉 了 顺序 上 的 不 同 。 不 难说 明 , 每 一 棵 语法 分 析 树 都 
和 唯一 的 最 左 排 导 及 唯一 的 最 右 推 导 相 关联 。 
4.2.5 二 义 性 

根据 2. 2.4 节 的 介绍 可 知 ， 如果 一 个 文法 可 以 为 某 个 句子 生成 多 棵 语法 分 析 树 ,那么 它 就 是 
TAM (ambiguous) « BEATE, 一 义 性 文法 名 是 对 则 一 个 句子 有 多 个 最 左 推导 或 多 个 最 有 失 
导 的 文法 。 


例 -4.11 





算术 表达 式 文法 (4.3) 允许 句子 id + id * id 具有 两 个 最 左 推导 : 
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E > E+E E > ExE 
> id +E > E+E # E 
> id+E* E > id+E*« FE 
= id + id * E = id + id * E 
> id + id * id = id + id * id 


相应 的 语法 分 析 树 如 图 4-5 所 示 。 
请 注意 ,图 4-5a 中 的 语法 分 析 树 反映 了 通常 的 + 
和 * 之 间 的 优先 级 关系 ,而 图 4-5b 中 的 语法 分 析 树 则 


B E 
ASS AA 
E + E E ¥ 
Wl 
E * E i 


a 





E + E id 
没有 反映 出 这 一 点 。 也 就 是 说 , 按照 惯例 ,应 该 将 运算 | L 1 
> wa rey ae id i i i 
符 * 当 作 优先 级 高 于 + 的 运算 符 来 处 理 ， 相应 地 , 我 
们 通常 将 a + 5 * “这 样 的 表达 式 按照 + (b * c), 
=p 图 4-5 id +id = id 的 两 棵 语法 树 
而 不 是 (a +b) * < 的 方式 进行 求 值 。 o a, 


大 部 分 语法 分 析 器 都 期 望 文法 是 无 二 义 性 的 ， 否 则 , 我 们 就 不 能 为 一 个 句子 唯一 地 选 定语 法 分 
析 树 。 在 某 些 情况 下 ,使 用 经 过 精心 选择 的 二 义 性 文法 也 可 以 带 来 方便 。 但 同时 需要 使 用 消 二 义 性 
规则 ( disambiguating mule) 来 “抛弃 ”不 想 要 的 语法 分 析 树 ， 只 为 每 个 句子 留 下 一 棵 语法 分 析 树 。 
4.2.6 验证 文法 生成 的 语言 

推断 出 一 个 给 定 的 产生 式 集合 生成 了 某 种 特定 的 语言 是 很 有 用 的 ,尽管 编译 器 的 设计 者 很 少 会 
对 整个 程序 设计 语言 文法 做 这 样 的 事情 。 当 研究 一 个 环 手 的 构造 时 , 我 们 可 以 写 出 该 构造 的 一 个 简 
洁 、 抽 象 的 文法 , 并 研究 该 文法 生成 的 语言 。 我 们 将 为 下 面 的 条 件 语句 构造 出 这 样 的 文法 。 

证 明文 法 C 生 成 语言 工 的 过 程 可 以 分 成 两 个 部 分 : 证 明 6 生成 的 每 个 串 都 在 工 中 , 并 且 反 向 
证 明 工 中 的 每 个 串 都 确实 能 由 G 生成 。 
Gl 4. 12 考虑 下 面 的 文法 ; 











S>(S)Sle (4.13) 

初 看 可 能 不 是 很 明显 , 但 这 个 简单 的 文法 确实 生成 了 所 有 具有 对 称 括 号 对 的 串 , 并 且 只 生成 这 样 
的 串 。 为 了 说 明 原因 ， 我们 将 首先 说 明 从 S 推导 得 到 的 每 个 句子 都 是 括号 对 称 的 , 然后 说 明 每 个 
括号 对 称 的 捉 都 可 以 从 5 推导 得 到 。 为 了 证 明 从 5 推导 出 的 每 个 句子 都 是 括号 对 称 的 , 我 们 对 推 
导 步 数 n 进行 归纳 。 

基础 : 基础 是 n=1。 唯 一 可 以 从 5 经 过 一 步 推导 得 到 的 终结 符号 串 是 空 串 , 它 当 然 是 括号 对 
称 的 。 

归纳 步骤 : 现在 假设 所 有 步 数 少 于 n 的 推导 都 得 到 括号 对 称 的 句子 , 并 考虑 一 个 恰巧 有 nn 步 
的 最 左 推导 。 这 样 的 推导 必然 具有 如 下 形式 : 

S=(S)S=>(x)S (x) y 

从 5 到 x 和 y 的 推导 过 程 都 少 于 nn 步 , 因此 根据 归纳 假设 ,x 和 y BA SA. PAL, P 
(a) y 必 然 是 插 号 对 称 的 。 也 就 是 说 , 它 具 有 相同 数量 的 左 插 号 和 右 括号 ， 并 且 它 的 每 个 前 级 中 
的 左 括号 不 少 于 右 括 号 。 

现在 已 经 证 明了 可 以 从 $ 推导 出 的 任何 串 都 是 括号 对 称 的 , 接 下 来 我 们 必须 证 明 每 个 括号 
对 称 的 串 都 可 以 从 S 推导 得 到 。 为 了 证 明 这 一 点 , 我 们 对 串 的 长 度 进行 归纳 。 

基础 : 如 果 串 的 长 度 是 0,， 它 必然 是 se。 这 个 串 是 括号 对 称 的 , 且 可 以 从 S 推导 得 到 。 

归纳 步骤 : 首先 请 注意 ,每 个 括号 对 称 的 串 的 长 度 是 偶数 。 假 设 每 个 长 度 小 于 2m 的 括号 对 称 
的 串 都 能 够 从 S 推导 得 到 , 并 考虑 一 个 长 度 为 2n(n 宕 1) 的 括号 对 称 的 串 w。ww 一 定 以 左 插 号 开 








130 第 4 章 





头 。 令 (z) 是 w 的 最 短 的 、 左 括号 个 数 和 右 括 号 个 数 相同 的 非 空前 绷 ,那么 w 可 以 写成 w= (x) y 
的 形式 , 其 中 x 和 yy 都 是 括号 对 称 的 。 因 为 x 和 y 的 长 度 都 小 于 2n, 根据 归纳 假设 , 它们 可 以 从 
S 推导 得 到 。 因 此 , 我 们 可 以 找到 一 个 如 下 形式 的 推导 : 
S3(S)S3(x)S S(x)y 
CUE w= (x)y 也 可 以 从 S 推导 得 到 。 口 
4.2.7 上 下 文 无 关 文 法 和 正则 表达 式 
在 结束 关于 文法 及 其 性 质 的 讨论 之 前 , 我 们 要 说 明文 法 是 比 正 则 表达 式 表 达能 力 更 强 的 表 
示 方 法 。 每 个 可 以 使 用 正则 表达 式 描 述 的 构造 都 可 以 使 用 文法 来 描述 , 但 是 反之 不 成 立 。 换 名 
话说 , 每 个 正则 语言 都 是 一 个 上 下 文 无 关 语 言 , 但 是 反之 不 成 立 。 
比如 , 正则 表达 式 (alb)* abb 和 文法 
Ag—adg! bAg| aA, 
A,;—bA, 
A,—+bA, 
43 一 6 
- 描述 了 同一 个 语言 , 即 以 abb 结尾 的 由 a 和 4 组 成 的 串 的 集合 。 
我 们 可 以 机 械 地 构造 出 和 一 个 不 确定 有 穷 自动 机 (NFA ) 识 别 同样 语言 的 文法 。 上 面 的 文法 
是 使 用 下 面 的 构造 方法 , 根据 图 3-24 中 的 NFA 构造 得 到 的 。 
1) 对 于 NFA 的 每 个 状态 i, 创建 一 个 非 终 结 符号 Aio 
2) 如 果 状 态 i 有 一 个 在 输入 a 上 到 达 状 态 j 的 转换 , 则 加 入 产生 式 A alo WERS i 在 给 
入 上 到 达 状 态 j, 则 加 入 产生 式 Aj; 
3) 如 果 ;是 一 个 接受 状态 , 则 加 入 产生 式 4, 一 +e。 
4) 如 果 i 是 自动 机 的 开始 状态 , 令 4; 为 所 得 文法 的 开始 符号 。 
另 一 方面 , 语言 L= lab" n=l} ( 即 由 同样 数量 的 a 和 5 组 成 的 串 的 集合 ) 是 一 个 可 以 用 文 
法 描述 但 不 能 用 正则 表达 式 描述 的 语言 的 原型 例子 。 下 面 用 反 证 法 来 说 明 这 一 点 。 假 设 工 是 用 
某 个 正则 表达 式 定义 的 语言 。 我 们 可 以 构造 一 个 具有 有 穷 多 个 状态 ( 比如 说 下 个 状态 ) 的 DFA D 
来 接受 上 。 因 为 D 只 有 上 个 状态 , 对 于 一 个 以 多 于 k 个 a 开头 的 输入 , DD 一 定 会 进入 某 个 状态 两 
K, 假设 这 个 状态 是 s,, 如 图 4- 6 所 示 。 假 设 从 s 返回 到 其 自身 的 路 径 的 标号 序列 是 ai-'。 因 为 
ab 在 这 个 语言 中 ,因此 必然 存在 一 条 标号 为 cj: 的 路 径 


标号 为 ODA si 到 某 个 接受 状态 /的 路 

径 。 但 是 ,一 定 还 存在 一 条 从 开始 状态 erate ) emails 
标号 为 a 的 路 径 i HEA b HIRIE 

so 出 发 ,经 过 % 最 后 到 达 /的 路 径 , 它 O … s 2 


的 标号 序列 为 dbi, 如 图 4-6 所 示 。 因 
此 ,D 也 接受 db, 但 oj 站 这 个 串 不 在 语 
ALP, 这 和 工 是 DD 所 接受 的 语言 这 个 假设 矛盾 。 
我 们 通俗 地 说 “有 穷 自动 机 不 能 计数 ”, 这 意味 着 有 穷 自 动机 不 能 接受 像 1a"b"1n 宕 11 这 样 
的 语言 , 因为 它 不 能 记录 下 在 它 看 到 第 一 个 b 之 前 读 入 的 a 的 个 数 。 类 似 地 ,“ 一 个 文法 可 以 对 两 
个 个 体 进行 计数 , 但 是 无 法 对 三 个 个 体 计数 ”, 我 们 在 4.3.5 节 中 考虑 非 上 下 文 无 关 的 语言 构造 
时 将 介绍 这 一 点 。 
4.2.8 4.2 节 的 练习 
练习 4. 2. 1: 考虑 上 下 文 无 关 文法 : 























图 4-6 F a'b Al ob’ AY DFA D 











SoSS +4 1SS * la 
IEE aata, 
1) 给 出 这 个 串 的 一 个 最 左 推导 。 
2) 给 出 这 个 串 的 一 个 最 右 推导 。 
3) 给 出 这 个 串 的 一 标语 法 分 析 树 。 
! 4) 这 个 文法 是 否 为 二 义 性 的 ”证 明 你 的 回答 。 
1 5) 描述 这 个 文法 生成 的 语言 。 
练习 4. 2.2: 对 下 列 的 每 一 对 文法 和 串 重 复 练习 4.2.1。 
1) S30 $1101 #48 000111, 
2) S++ SSS| x SSS| aff + * aaa, 
13) S>S (S) Sle #lA(()()). 
14) SoS +SISS1(S) 1S [a 和 串 (a+a) *a, 
! 5) S> ( L) la IK L>L, $15 MR( (a, a), a, (a))。 
1! 6) SseaSbS\lbSaS 1 € AA aabbab。 
17) 下 面 的 布尔 表达 式 对 应 的 文法 : 
- l bexpr—bexpr or bterm | bterm 
bterm—bterm and bfactor | bfactor 
bfactor—not bfactor | ( bexpr ) | true | false 
练习 4. 2.3: 为 下 面 的 语言 设计 文法 : 
1) 所 有 由 0 和 1 组 成 的 并 且 每 个 0 之 后 都 至 少 跟着 一 个 1 的 串 的 集合 。 


串 的 集合 。 | 

13) 所 有 由 0 和 1 组 成 的 具有 相同 多 个 0 和 1 BMRA. 

11 4) 所 有 由 0 和 1 组 成 的 并 且 0 的 个 数 和 1 的 个 数 不 同 的 串 的 集合 。 

15) 所 有 由 0 和 1 组 成 的 且 其 中 不 包含 子 串 011 的 串 的 集合 。 

1! 6) 所 有 由 0 和 1 组 成 的 形 如 xy 的 串 的 集合 , HP rty Box ily SHE, 

| 练习 4. 2. 4: 有 一 个 常用 的 扩展 的 文法 表示 方法 。 在 这 个 表示 方法 中 , 产生 式 体 中 的 方 括 
号 和 花 括 号 是 元 符号 (如 一 或 |), 且 具 有 如 下 含义 : 

1) 一 个 或 多 个 文法 符号 两 边 的 方 括号 表示 这 些 构造 是 可 选 的 。 因 此 , 产生 式 ASX Y] 和 
两 个 产生 式 4 一 XYZ 及 4 一 XZ 具有 相同 的 效果 。 

2) 一 个 或 多 个 文法 符号 两 边 的 花 括号 表示 这 些 符 号 可 以 重复 任意 多 次 (包括 零 次 ) 。 因 此 ， 
AX | YZ} 和 如 下 的 无 穷 产 生 式 序列 具有 相同 的 效果 : 4 一 了 ,A 一 XYZ ,4 一 XYZYZ ,… 等 等 。 
证 明 这 两 个 扩展 并 没有 增加 文法 的 功能 。 也 就 是 说 , 由 带 有 这 些 扩 展 表示 的 文法 生成 的 任何 语 
言 都 可 以 由 一 个 不 带 扩展 表示 的 文法 生成 。 

练习 4. 2. 5: 使 用 练习 4. 2. 4 中 描述 的 括号 表示 法 来 简化 如 下 的 关于 语句 块 和 条 件 语句 的 文法 。 


stmt — if expr then sim else stmi 





| iff stmt then stmt 
| begin stmiList end 
stmiList— stmt; stmtList | stmt 
! 练习 4.2.6: 扩展 练习 4.2.4 的 思想 , 使 得 产生 式 体 中 可 以 出 现 文法 符号 的 任意 正则 表达 
式 。 证 明 这 个 扩展 并 没有 使 得 文法 可 以 定义 任何 新 的 语言 。 
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| 练习 4.2.7: 如 果 不 存在 形 如 S SwXy Sway 的 推导 ,那么 文法 符号 X( 终 结 符号 或 非 终结 
符号 ) 就 被 称 为 无 用 的 (useless)。 也 就 是 说 , X 不 可 能 出 现在 任何 句子 的 推导 过 程 中 。 

1) 给 出 一 个 算法 ， 从 一 个 文法 中 消除 所 有 包含 无 用 符号 的 产生 式 。 

2) 将 你 的 算法 应 用 于 以 下 文法 : 




















Ben la stmt — declare id optionList 
A—AB optionList —  optionList option | € 
; option -+ mode | scale | precision | base 
Bol mode => real | complex 
#2) 4.2.8. 图 4-7 中 的 文法 可 生成 单个 数值 scale + fixed | floating 
<p A hh h Saree A a une precision + single | double 
标识 符 的 声明 » 这些 声明 包含 四 种 不 同 的 、 相互 独 base + binary | decimal 
立 的 数字 性 质 。 
1) PRA 4-7 中 的 文法 , 使 得 它 可 以 允许 n 图 4-7 多 属性 声明 的 文法 


种 选项 4 ,其 中 是 一 个 固定 的 数 , i=1, 2,…,n。 选 项 4; 的 取 值 可 以 是 o 或 总 。 你 的 文法 只 
能 使 用 0(n) 个 文法 符号 ,并且 产生 式 的 总 长 度 也 必须 是 O(n) 的 。 

! 2) 图 4-7 中 的 文法 和 它 在 1 中 的 扩展 支持 互相 矛盾 或 元 余 的 声明 ,比如 : 

declare foo real fixed real floating j 

我 们 可 以 要 求 这 个 语言 的 语法 禁止 这 种 声明 。 也 就 是 说 , 由 这 个 文法 生成 的 每 个 声明 中 , n 
种 选项 中 的 每 一 项 都 有 且 只 有 一 个 取 值 。 如 果 我 们 这 样 做, 那么 对 于 任意 给 定 的 n 值 , 合法 声明 
的 个 数 是 有 穷 的 。 因 此 和 任何 有 穷 语言 一 样 , 合法 声明 组 成 的 语言 有 一 个 文法 (同时 也 有 一 个 正 
则 表达 式 ) 。 最 显而易见 的 文法 是 这 样 的 : 文法 的 开始 符号 对 每 个 合法 声明 都 有 一 个 产生 式 ， 这 
样 共有 n! 个 产生 式 。 该 文法 的 产生 式 的 总 长 度 是 O(n x n1) 。 你 必须 做 得 更 好 : 给 出 一 个 产生 
式 总 长 度 为 0(n2") 的 文法 。 

!! 3) 说 明 对 于 任何 满足 2 中 的 要 求 的 文法 ， 其 产生 式 的 总 长 度 至 少 是 2"。 

4) 我 们 可 以 通过 程序 设计 语言 的 语法 来 保证 声明 中 的 选项 无 宛 余 性 、 无 矛盾 。 对 于 这 个 广 
法 的 可 行 性 , 本 题 3 的 结论 说 明了 什么 问题 ? 


4.3 设计 文法 


文法 能 够 描述 程序 设计 语言 的 大 部 分 (但 不 是 全 部 ) 语法 。 比 如 , 在 程序 中 标识 符 必须 先 声 
明 后 使 用 , 但 是 这 个 要 求 不 能 通过 一 个 上 下 文 无 关 文 法 来 描述 。 因 此 ， 一 个 语法 分 析 器 接受 的 词 
法 单元 序列 构成 了 程序 设计 语言 的 超 集 ; 编译 器 的 后 续 步 又 必须 对 语法 分 析 器 的 输出 进行 分 析 ， 
以 保证 源 程序 遵守 那些 没有 被 语法 分 析 器 检查 的 规则 。 

本 节 将 先 讨论 如 何在 词法 分 析 器 和 语法 分 析 器 之 间 分 配 工作 。 然 后 考虑 几 个 用 来 使 文法 更 
适 于 语法 分 析 的 转换 方法 。 其 中 的 一 个 技术 可 以 消除 文法 中 的 二 义 性 , 而 其 他 的 技术 一 一 消除 
左 递 归 和 提取 左 公 因子 一 可 用 于 改写 文法 , 使 得 这 些 文法 适用 于 自 顶 向 下 的 语法 分 析 。 我 们 
在 本 节 的 最 后 将 考虑 一 些 不 能 使 用 任何 文法 描述 的 程序 设计 语言 构造 。 
4. 3. 1 词法 分 析 和 语法 分 析 

如 我 们 在 4.2.7 节 看 到 的 ,任何 能 够 使 用 正则 表达 式 描述 的 东西 都 可 以 使 用 文法 描述 。 因 此 
我 们 自然 会 间 :“ 为 什么 使 用 正则 表达 式 来 定义 一 个 语言 的 词法 语法 ?”, 理由 有 多 个 。 

1) 将 一 个 语言 的 语法 结构 分 为 词法 和 非 词法 两 部 分 可 以 很 方便 地 将 编译 器 前 端 模块 化 , 将 
前 端 分 解 为 两 个 大 小 适中 的 组 件 。 

2) 一 个 语言 的 词法 规则 通常 很 简单 ,我 们 不 需要 使 用 像 文法 这 样 的 功能 强大 的 表示 方法 来 
描述 这 些 规则 。 
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3) 积 文法 相 比 , 正则 表达 式 通 常 提供 了 更 加 简洁 且 易 于 理解 的 表示 词法 单元 的 方法 。 

A) 根据 正则 表达 式 自动 构造 得 到 的 词法 分 析 器 的 效率 要 高 于 根据 任意 文法 自动 构造 得 到 的 
分 析 器 。 

并 不 存在 一 个 严格 的 指导 方针 来 规定 哪些 东西 应 该 放 到 (和 语法 规则 相对 的 ) 词法 规则 中 。 
正则 表达 式 最 适合 描述 诸如 标识 符 、 常 量 、 关 键 字 、 空 户 这 样 的 语言 构造 的 结构 。 另 一 方面 , 文 
法 最 适合 描述 梭 大 结构， 比如 对 称 的 括号 对 ， 匹配 的 begin-end, 相互 对 应 的 if-then-else 等 。 这 些 
和 做 套 结构 不 能 使 用 正则 表达 式 描述 。 

4.3.2 消除 二 义 性 
有 时 ,一 个 二 义 性 文法 可 以 被 改写 为 无 二 义 性 的 文法 。 例 如 , 我 们 将 消除 下 面 的 “悬空 -else” 
文法 中 的 二 义 性 : | 
stmt — if expr then stmt 
| if expr then stmt else stmi (4. 14) 
| other 

这 里 “other” 表 示 任 何其 他 语句 。 根 据 这 个 文法 , 下 面 的 复合 条 件 语句 

if E, then S, else if E, then S, else S, 
的 语法 分 析 树 如 图 4-8 MRO, XE 14) 是 二 义 性 的 ， 因 为 串 





if E, then if E, then S} else S, (4. 15) 
具有 图 4-9 所 示 的 两 棵 语法 分 析 树 。 
Ae 
if PN, then Pd else stmt o 
= Si e vd oo stmt 
E: Sa S3 


Bl 4-8 一 个 条 件 语句 的 语 SD AT RT 


stmt simi. 


ee Pror o ee 


ATN then stmt_«. if cxpr then stmt. else stm? 


Gre aa ~ 


PN then simi ss sim if expr then stmt 





< Sy So 五 2 Si 
图 4-9 一 个 二 义 性 句子 的 两 颗 语 法 分 析 树 
在 所 有 包含 这 种 形式 的 条 件 语句 的 程序 设计 语言 中 ， 选择 第 一 棵 语法 分 析 树 。 通 用 
的 规则 是 “每 个 else 和 最 近 的 尚未 匹配 的 then 匹配 。 CET, 这 个 消除 二 义 性 规则 可 以 
用 一 个 文法 直接 表示 , 但 是 在 实践 中 很 少 用 产生 式 来 表示 该 规则 。 
| ”我 们 可 以 将 悬空 -else 文法 (4. 14) 改写 成 如 下 的 无 二 义 性 文法 。 基 本 思想 是 在 一 个 
then 和 一 个 else 之 间 出 现 的 语句 必须 是 “已 匹配 的 。 也 就 是 说 , 中 间 的 语句 不 能 以 一 个 尚未 下 











O EMS 的 下 标 仅 用 于 区 分 同一 个 非 终结 符号 的 不 同 出 现 , 并 不 表示 不 同 的 非 终结 符号 。 
© ”我们 应 该 注意 到 ,C 语言 和 它 的 派生 语言 也 属于 这 一 类 语言 。 虽 然 C 系列 的 语言 不 使 用 关键 字 then, {8 then 的 作 
用 是 由 这 之 后 的 条 件 表达 式 的 括号 对 来 承担 的 
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配 的 (或 者 说 开放 的 ) then 结尾 。 一 个 已 匹配 的 语句 要 么 是 一 个 不 包含 开放 语句 的 if-then-else 语 
A, 要 么 是 一 个 非 条 件 语 句 。 因 此 我 们 可 以 使 用 图 4-10 中 的 文法 。 这 个 文法 和 悬空 -else 文 法 


《4.14) 生 成 同样 的 串 集 合 , 但 是 它 只 允许 对 串 (4. 15 ) 进行 一 种 语法 分 析 , 也 就 是 将 每 个 else 和 
前 面 最 近 的 尚未 匹配 的 then 匹配 。 O 





simi — matched-stmi 

| open.stmt 

-+ if expr then matched stmt else matched_stmt 
| other 

> if expr then stmt 

| if expr then matched-stmt else open_stmt 


matched_stmt 


open simil 











14-10 if-then-else 语句 的 无 二 义 性 方法 


4.3.3 左 递归 的 消除 
如 果 一 个 文法 中 有 一 个 非 终 结 符号 4 使 得 对 某 个 串 a FETE MEE AS Aa, 那么 这 个 文法 

就 是 左 递归 的 (left recursive)。 自 顶 向 下 语法 分 析 方 法 不 能 处 理 左 递归 的 文法 ,因此 需要 一 个 转 
换 方法 来 消除 左 递归 。 在 2.4.5 节 中 , 我 们 讨论 了 立即 堪 递归 , 即 存在 形 如 4 一 4a 的 产生 式 的 情 
况 。 这 里 我 们 研究 一 般 性 的 情形 。 在 2.4.5 节 中 , 我 们 说 明了 如 何 把 左 递归 的 产生 式 对 4 一 
Ao | B 蔡 换 为 非 左 递归 的 产生 式 : 

A —>BA' 

A'aA' le 
TPE NARA EET MA 推导 得 到 的 串 的 集合 。 这 个 规则 本 身 已 经 足以 用 来 处 理 很 多 文法 。 
JR 。 这 里 重复 一 下 非 左 递归 的 表达 式 文法 (4.2): 











E = TE’ 
E — +TE'le 
T = FT'+ 


T — +FT'le 
F 一 (E)lid 
它 是 通过 消除 表达 式 文 法 (4.1) 中 的 立即 左 递归 而 得 到 的 。 左 递归 的 产生 式 对 E 一 +7T | T 
AEST Er 和 一 + TE | es 类似 地 ,了 和 的 新 产生 式 也 是 通过 消除 立即 左 递归 而 得 到 的 。 口 
立即 左 递 归 可 以 使 用 下 面 的 技术 消除 ,该 技术 可 以 处 理 任意 数量 的 4 产生 式 。 首 先 将 4 的 
全 部 产生 式 分 组 如 下 : 
A--+-Aa,! Aayl + | Ao! By! Bol … | Ba 
其 中 B; 都 不 以 4 开头 。 然 后 , 将 这 些 A PRA CROW : 
4 一 Bi4 | BoA’ | e l BA’ 
4 一 ai4 Lad’ le la,’ le 
非 终结 符号 4 He COO VLE AE LE BE, 但 不 再 是 左 递归 的 。 这 个 过 程 消除 了 所 
有 和 4 和 4 的 产生 式 相关 的 左 递归 (前 提 是 a; 都 不 是 e), 但 是 它 没有 消除 那些 因为 两 步 或 多 步 
推导 而 产生 的 左 递归 。 比 如 , 考虑 文法 





So-Aal b 
A-AcISdle (4.18) 
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因为 Sa AaSda ,所 以 非 终结 符号 S 是 左 递 归 的 , 但 它 不 是 立即 左 递归 的 。 

下 面 的 算法 4. 19 系统 地 消除 了 文法 中 的 左 递归 。 如 果 文 法 中 不 存在 环 ( 即 形 如 4 SA 的 推 
导 ) 或 e 产 生 式 ( 即 形 如 Ae 的 产生 式 ) ， 就 保证 能 够 消除 左 递归 。 环 和 ee 产生 式 都 可 以 从 文法 
中 系统 地 消除 ( 见 练习 4.4.6 和 练习 4.4.7)。 
ask 4: MRAR. 

输入 : 没有 环 或 e 产生 式 的 文法 Co 

输出 : 一 个 等 价 的 无 左 递归 文法 。 

方法 : 对 6 应 用 图 4-11 中 的 算法 。 请 注意 ,得 到 的 非 左 递归 文法 可 能 具有 se 产生 式 。 口 

图 4-11 中 的 过 程 的 工作 原理 恕 下。 在 := 1 的 第 一 次 迭代 中 , 第 2 ~7 行 的 外 层 循环 消除 了 
A, 产生 式 之 间 的 所 有 立即 左 递归 。 因 此 ,余下 的 所 有 形 如 41 一 hja 的 产生 式 都 一 定 满足 1>1。 在 
外 层 循环 的 第 i-1 次 迭代 之 后 , 所 有 的 非 终 结 符号 AC <i) 都 被 “清洗 ”过 了 。 也 就 是 说 , 任何 
产生 式 A, Alo 都 必然 满足 1 >k。 结 果 , 在 第 i 次 迭代 中 , 第 3 ~5 行 的 内 层 循环 不 断 提高 所 有 形 
如 4; 一 4na 的 产生 式 中 m 的 下 界 ， 直到 mei 成 立 为 止 。 然 后 ,第 6 行 消除 了 4; 产生 式 中 的 立即 
左 递 归 , 保证 m >i 成 立 。 








1) ”按照 某 个 顺序 将 非 终结 符号 排序 为 A, Ao... An 

2) for (从 1 到 n 的 每 个 i) { 

3) for (从 1 到 i 一 1 的 每 个 了) 

4) 将 每 个 形 如 4i 一 Ajy PEPER A; 一 Oy | doy | … | Oey, 
其 中 4j by | 62 | | 的 是 所 有 的 二 产生 式 


} 
6) 消除 .Ai 产生 式 之 间 的 立即 左 递归 
} 


~ 
< 











图 4-11 消除 文法 中 的 左 递归 的 算法 


我 们 将 算法 4. 19 应 用 于 文法 (4. 18) 。 从 技术 上 讲 , 因为 该 算法 有 产生 式 , 所 以 这 
个 算法 不 一 定 能 得 到 正确 结果 。 但 在 这 个 例子 中 , 最 终 会 证 明 产生 式 Ae 是 无 害 的 。 
我 们 将 非 终 结 符号 排序 为 5, 4。 在 S 产生 式 之 间 没 有 立即 左 递归 , 因此 在 i=1 的 外 层 循环 





中 不 进行 任何 处 理 。 当 i=2 时 ,我们 蔡 换 4 一 'Sd 中 的 5, 得 到 如 下 的 4 产生 式 。 


A—*4clAadlbdle 
消除 这 些 4 产生 式 之 间 的 立即 左 递归 , 得 到 如 下 的 文法 : 


S-Aalb 
Ab d A' 1 A’ 
A'acA' ladA'le 口 


4.3.4 提取 左 公 因子 
提取 左 公 因子 是 一 种 文法 转换 方法 , 它 可 以 产生 适用 于 预测 分 析 技 术 或 自 顶 向 下 分 析 技 术 
的 文法 。 当 不 清楚 应 该 在 两 个 A 产生 式 中 如 何 选择 时 , 我 们 可 以 通过 改写 产生 式 来 推 后 这 个 决 
E, 等 我 们 读 入 了 足够 多 的 输入 , 获得 足够 信息 后 再 做 出 正确 选择 。 
比如 ， 如 果 我 们 有 两 个 产生 式 


stmt —if expr then stmt else stmt 





lif expr then stmt 
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在 看 到 输入 让 的 时 候 , 我 们 不 能 立刻 指出 应 该 选择 哪个 产生 式 来 展开 stmt。 一 般 来 说 ， 如 果 
A 一 aB11 a8: 是 两 个 4 产生 式 ， 并 且 输 入 的 开头 是 从 a 推导 得 到 的 一 个 非 空 串 , 那么 我 们 就 不 知 


E, EIRATA a 推导 得 到 的 输入 前 弘之 后 , 我 们 再 决定 将 4' 展 开 为 B1 Rp 。 也 就 是 说 ， 经 过 
提取 左 公 因子 , 原来 的 产生 式 变 成 了 
A>aA’ 
A'—B, l Bo 
对 一 个 文法 提取 左 公 因子 。 
BN: 文法 GC. 
输出 : 一 个 等 价 的 提取 了 左 公 因子 的 文法 。 
方法 : 对 于 每 个 非 终结 符号 4, 找 出 它 的 两 个 或 多 个 选项 之 问 的 最 长 公共 前 缀 w。 如 果 a 关 e， 
即 存在 一 个 非 平 几 的 公共 前 级 ,那么 将 所 有 A 产生 式 AaB, 1a8:1…1a8,| y HA 
4 一 oa4 | y 
4 一 611p821…1p， 
其 中 ,Yy 表示 所 有 不 以 a 开头 的 产生 式 体 ;4' 是 一 个 新 的 非 终结 符号 。 不 断 应 用 这 个 转换 ， 直 到 每 
个 非 终结 符号 的 任意 两 个 产生 式 体 都 没有 公共 前 缀 为 止 。 C] 
ee | FAY CRNA T “BA -else” A: 
SsikF-tS|iktSeSla ° (4, 23) 
E—>b 
这 里 六 上 和 ee (U# if, then F else; 5 和 5 表示“ 条件 表 达 式 ”和 “语句 ”。 提 取 左 公 因 子 后 , 这 
个 文法 变 为 : 








SoiEtSS'la 

S'se Sle (4, 24) 

Eb 
这 样 ,我 们 可 以 在 输入 为 i 时 将 S 展开 为 :ESS', 并 在 处 理 IES 之 后 才 决 定 将 5' 展 开 为 eS 还 是 e。 
当然 ,上面 的 两 个 文法 都 是 二 义 性 的 ， 当 输入 为 。 时 不 能 够 确定 应 该 选择 5' 的 哪个 产生 式 。 例 子 
4. 33 将 讨论 一 个 可 以 摆脱 这 个 困境 的 方法 。 0 
4.3.5 非 上 下 文 无 关 语 言 的 构造 

在 常见 的 程序 设计 语言 中 ,可 以 找到 少量 不 能 仅 用 文法 描述 的 语法 构造 。 这 里 ,我 们 考虑 其 
中 的 两 种 构造 , 并 使 用 简单 的 抽象 语言 来 说 明 其 困难 之 处 。 

也 汪 六 ”这 个 例子 中 的 语言 抽象 地 表示 了 检查 标识 符 在 程序 中 先 声明 后 使 用 的 问题 。 这 个 语 
言 由 形 如 wew 的 串 组 成 , 其 中 第 一 个 w 表示 某 个 标识 符 w 的 声明 , 。 表示 中 间 的 程序 片段 ， 第 二 
个 ww 表示 对 这 个 标识 符 的 使 用 。 

这 个 抽象 语言 是 五 = |wew | w 在 (a15)* 中 |。Li 包含 了 所 有 符合 以 下 要 求 的 字 , 字 中 包含 
两 个 相同 的 由 a, b MARP, APLAR, 比如 aabcaog。 这 个 L 不 是 上 下 文 无 关 的 , 虽然 
证 明 这 一 点 已 经 超出 了 本 书 的 范围 。Li 的 非 上 下 文 无 关 性 表明 了 像 C 或 Java 这 样 的 语言 不 是 上 
下 文 无 关 的 ,因为 这 些 语言 都 要 求 标识 符 要 先 声明 后 使 用 , 并 且 支 持 任意 长 度 的 标识 符 。 

出 于 这 个 原因 ，C 或 者 Java 的 文法 不 区 分 由 不 同 字符 串 组 成 的 标识 符 。 所 有 的 标识 符 在 文法 
中 都 被 表示 为 像 各 这 样 的 词法 单元 。 在 这 些 语言 的 编译 器 中 ,标识 符 是 否 先 声明 后 使 用 是 在 语 











义 分 析 阶 段 检查 的 。 
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Pipes 这 个 例子 中 的 非 上 下 文 无 关 语 言 抽象 地 表示 了 参数 个 数 检查 的 问题 。 它 检查 一 个 函 
数 声 明 中 的 形式 参数 个 数 是 否 等 于 该 函数 的 某 次 使 用 中 的 实在 参数 个 数 。 个 语言 由 形 如 
abcd" 的 串 组 成 ( 记 住 ,a" 表示 nn 个 a)。 这 里 ,a" Ab” 可 以 表示 两 个 分 别 i n Alm 个 参数 的 
水 数 声 明 的 形式 参数 列 崩 ; 而 c" 和 a 分 别 表 示 对 这 两 个 盟 数 的 调用 中 的 实在 参数 列表 。 

这 个 抽象 语言 是 L = fa b™c"d"| n=l 且 m 宇 1 。 也 就 是 说 , 5 包含 的 串 都 在 正则 表达 式 

a*b*c*d* 所 生成 的 语言 中 , 并 且 a Alc 的 个 数 相 同 ,b 和 和 4 的 个 数 相 同 。 这 个 语言 不 是 上 下 文 

无 关 的 。 

同样 ， 函 数 声 明和 使 用 的 常用 语法 本 身 并 不 考虑 参数 的 个 数 。 比 如 , 一 -个 类 C 话 言 中 的 函数 
调用 可 能 被 描述 为 





stmt — id (expr_list) 
expr_list — expr_list, expr 
| expr 
其 中 expr 另 有 适当 的 产生 式 。 检 查 一 次 调用 中 的 参数 个 数 是 否 正确 通常 是 在 语义 分 析 阶 段 完 
成 的 。 O 
4.3.6 4.3 节 的 练习 
练习 4. 3.1: 下 面 是 一 个 只 包含 符号 a 和 “的 正则 表达 式 的 文法 。 它 使 用 + SRI N 

的 字符 | ， 以 避免 和 文法 中 作为 元 符号 使 用 的 竖 线 相 混淆 : 


rexpr—rexpr + rierm | rterm 





rterm—rterm rfactor | rfactor 
rfactor—rfactor * | rprimary 
rprimary—a | b 
1) 对 这 个 文法 提取 左 公 因子 。 
2) 提取 无 公 因 子 的 变换 能 使 这 个 文法 适用 于 自 项 向 下 的 语法 分 析 技 术 吗 ? 
3) 提取 左 公 因子 之 后 , 从 原文 法 中 消除 左 递归 。 
4) 得 到 的 文法 适用 于 自 项 向 下 的 语法 分 析 吗 ? 
练习 4. 3.2: 对 下 面 的 文法 重复 练习 4.3.1; 
1) 练习 4.2.1 的 文法 。 
2) 练习 4.2.2(1) 的 文法 。 
3) 练习 4.2.2(3) 的 文法 。 
4) 练习 4.2.2(5) 的 文法 。 
5) 练习 4.2.2(7) 的 文法 。 
! 练习 4. 3. 3: 下 面 文法 的 目的 是 消除 4. 3. 2 节 中 讨论 的 “悬空 - else 二 义 性 ”: 
stmt —if expr then stmt 
| matchedStmt 
matchedStmt—if expr then matchedStmt else stmt 
| other 


说 明 这 个 文法 仍然 是 二 义 性 的 。 
4.4 自 顶 向 下 的 语法 分 析 
自 项 向 下 语法 分 析 可 以 被 看 作 是 为 输入 串 构 造 语法 分 析 树 的 问题 ， 它 从 语法 分 析 树 的 根 结 
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点 开始 , 按照 先 根 次 序 (如 2. 3.4 节 中 所 讨论 的 ,深度 优先 地 ) 创建 这 棵 语法 分 析 树 的 各 个 结 点 。 
自 顶 向 下 语法 分 析 也 可 以 被 看 作 寻 找 输入 串 的 最 左 推导 的 过 程 。 | 

TAZ B412 中 对 应 于 输入 id + id * 这 的 语法 分 析 树 序列 是 一 个 根据 文法 (4.2) 进行 的 
最 左 推导 序列 。 这 里 重复 一 下 这 个 文法 : 








E>TE' 
E+ TE' le 

T=F T' (4. 28) 
Ti+« FT’ le 

F—>( E) lid 

该 语法 分 析 树 序列 对 应 于 这 个 输入 的 一 个 最 左 推导 。 口 

在 一 个 自 顶 向 下 语法 分 析 的 每 一 步 中 , 关键 问题 是 确定 对 一 个 非 终结 符号 ( 比如 4) 应 用 哪 
个 产生 式 。 一旦 选择 了 某 个 4 产生 式 , 语法 分 析 过 程 的 其 余部 分 负责 将 相应 产生 式 体 中 的 终结 
符号 和 输入 相 匹 配 。 

本 节 首 先 给 出 被 称 为 递归 下 降 语法 分 析 的 自 顶 向 下 语法 分 析 的 通用 形式 ,这 种 方法 可 能 需要 
进行 回 湖 ， 以 找到 要 应 用 的 正确 4 产生 式 。2. 4. 2 节 介 绍 的 预测 分 析 技 术 是 递归 下 降 分 析 技 术 的 
一 个 特例 ， 它 不 需要 进行 回溯 。 预 测 分 析 技 术 通过 在 输入 中 向 前 看 固定 多 个 符号 来 选择 正确 的 4 
产生 式 。 通 常情 况 下 我 们 只 需要 向 前 看 一 个 符号 ( 即 只 看 下 一 个 输入 符号 ) 。 

比如 , 考虑 图 4-12 中 的 自 顶 向 下 语法 分 析 过 程 , 它 构造 出 了 一 棵 请 法 分 析 树 , 其 中 有 两 个 标 
号 为 E' 的 结 点 。 在 (按照 前 序 遍 历次 序 的 ) 第 一 个 E' 结 点 上 选择 的 产生 式 是 5 一 + TE; 在 第 二 
个 EE' 结 点 上 选择 的 产生 式 是 有 一 xe。 预 测 分 析 器 通过 查看 下 一 个 输入 符号 就 可 以 在 两 个 EB' 产 生 式 
中 选择 正确 的 产生 式 。 


E E > E => E => E E 
im /\ t / \ Im /\ t J \ Im J \ 
T.E T E T E' T T Eo 
ZA / \ /\ ZN AUN 
PT” T T i E F T + TE 
id id e id € 
E E E 
im 2 N Im a YW im x Se 
E' t 
De Led e a E 
X + Ji 
和 人 i AN 
id € F T! id € F T id < F p: 
| Ro FES 
id id * FT 
E E, E 
Im iy P ae im oes 
fee í T E' ra 4 J p @ ae E 
+ + al t 
JEN AN ETAN EAA 
id « F T: id < F T id € F T é 
L> ZN 1 SIN | ZIN 
id * F T' id * T r id * i i 
id id 上 id 上 


4-12 ia+idayid 的 自 顶 向 下 分 析 


对 于 有 些 文法 , 我 们 可 以 构造 出 向 前 看 个 输入 符号 的 预测 分 析 器 ,这 一 类 文法 有 时 也 称 为 
LL(E) 文 法 类 。 我 们 在 4.4.3 节 中 将 讨论 LL(1) 文 法 类 , 但 是 在 介绍 预备 知识 的 4.4.2 节 中 将 介 | 
绍 一 些 计算 FIRST 和 FOLLOW 集合 的 方法 。 根 据 一 个 文法 的 FIRST 和 FOLLOW 集合 , 我 们 将 构 
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造 出 “预测 分 析 表 ”, 它 说 明了 如 何在 自 顶 向 下 语法 分 析 过 程 中 选择 产生 式 。 这 些 集合 也 可 以 用 
于 自 底 向 上 语法 分 析 。 

.在 4.4.4 节 中 , 我 们 给 出 了 一 个 非 递 归 的 请 法 分 析 算 法 , 它 显 式 地 维护 了 一 个 栈 , 而 不 是 通 
过 递归 调用 隐 式 地 维护 一 个 栈 。 最 后 , 我 们 将 在 4. 4.5 节 中 讨论 自 顶 向 下 语法 分 析 过 程 中 的 错误 
恢复 问题 。 

4.4.1 递归 下 降 的 语法 分 析 

一 个 递归 下 降 语 法 分 析 程 序 由 一 组 过 程 组 成 ,每 个 非 终 结 符号 有 一 个 对 应 的 过 程 。 程 序 的 
执行 从 开始 符号 对 应 的 过 程 开 始 , 如 果 这 个 过 程 的 过 程 体 扫描 “了 整个 输入 串 , 它 就 停止 执行 并 宣 
布 语法 分 析 成 功 完 成 。 图 4-13 显示 了 对 应 于 某 个 非 终结 符号 的 典型 过 程 的 伪 代 码 。 请 注意 ,这 个 
伪 代 码 是 不 确定 的 ， 因为 它 没有 描述 如 何在 开始 时 刻 选择 4 产生 式 。 

通用 的 递归 下 降 分 析 技 术 可 能 需要 回溯 。 也 就 是 说 , 它 可 能 需要 重复 扫描 输入 。 然 而 , 在 对 
程序 设计 语言 的 构造 进行 语法 分 析 时 很 少 需要 回溯 ,因此 需要 回 湖 的 语法 分 析 器 并 不 常见 。 即 
使 在 自然 语言 语法 分 析 这 样 的 场合 , 回溯 也 不 是 很 高 效 ， 因 此 人 们 更 加 倾向 于 基于 表格 的 方法 ， 
比如 练习 4.4. 9 中 的 动态 程序 规划 算法 或 者 Earley 方法 (参见 参考 文献 ) 。 

要 支持 回溯 .就 需要 修改 图 4-13 的 代码 。 首 先 ,因为 我 们 不 能 在 第 1 行 选 定 唯 一 的 4 产生 
R, 我 们 必须 按照 某 个 顺序 逐个 尝试 这 些 产 生 式 。 那 么 ,第 7 行 上 的 失败 并 不 意味 着 最 终 失败 ， 
而 仅仅 是 建议 我 们 返回 到 第 1 行 并 尝试 另 一 个 4 产生 式 。 只 有 当 再 也 没有 4 产生 式 可 尝试 时 , 我 




















们 才 会 宣称 找到 了 一 个 输入 错误 。 为 了 尝试 另 一 ea 
个 4 产生 式 , 我 们 需要 把 输入 指针 重新 设置 到 我 |1) 选择 一 个 A 产生 式 ， 4 一 入 XX 
~ ~ s= Le He 2 i = 
们 第 一 次 到 达 第 1 行 时 的 位 置 。 因 此 ,需要 一 个 |) 0 a 
局 部 变量 来 保存 这 个 输入 指针 ， 以 供 将 来 回 湖 时 | 4) ARAL X10); 
使 用 5) else if ( X; 等 于 当前 的 输入 符号 a ) 
6) 读 人 下 一 个 输入 符号 ; 
“Bi 4 25 考虑 文法 T i else /* 发 生 了 一 个 错误 */; 
i S—c Ad } 











4 一 CD |a 
在 自 顶 向 下 地 构造 输入 串 w = cad 的 语法 分 KAL 在 自 项 向 下 语法 分 析 器 中 一 个 
析 树 时 ,初始 的 语法 分 析 树 只 包含 一 个 标号 为 S a 


的 结 点 , 输入 指针 指向 。,， 即 w 的 第 一 个 符 导 。5S 3 s s 
只 有 一 个 产生 式 , 因此 我 们 用 它 来 展开 5, 得 到 N a Mo a 
图 4-14a 中 的 树 。 最 左边 的 叶子 结 点 的 标号 为 <， FN | 
它 和 输入 w 的 第 一 个 符号 匹配 ,因此 我 们 将 输入 ook 


指针 推进 到 o, B w 的 第 二 个 符号 , 并 考虑 下 一 
个 标号 为 4 的 叶子 结 点 。 

现在 我 们 使 用 第 一 个 4 产生 式 Aab 来 展开 
A, 得 到 图 4-14b 所 示 的 树 。 第 二 个 输入 符号 a 得 到 匹配 , 因此 我 们 将 输入 指针 推进 到 d， 即 第 三 
个 输入 符号 , 并 将 d 和 下 一 个 叶子 结 点 (标号 为 8) 比较。 因为 6 和 4 不 匹配 , 我 们 报告 失败 ,并 
IEA, 查看 是 否 还 有 尚未 党 试 过 、 但 有 可 能 匹配 的 其 他 4 产生 式 。 

在 回 到 4 时 , 我 们 必须 把 输入 指针 重新 设置 到 位 置 2， 即 我 们 第 一 次 尝试 展开 4 时 该 指针 指 
向 的 位 置 。 这 意味 着 4 的 过 程 必须 将 输入 指针 存放 在 一 个 局 部 变量 中 。 

A 的 第 二 个 选项 产生 了 图 4-11e 所 示 的 树 。 叶 子 结 点 a 和 w 的 第 二 个 符号 匹配 , 叶子 结 点 d 


图 4-14 一 个 自 项 向 下 
语法 分 析 过 程 的 步骤 
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和 第 三 个 符号 相 匹配 。 因 为 我 们 已 经 产生 了 一 棵 w 的 语法 分 析 树 ,所 以 我 们 停止 分 析 并 宣称 已 
成 功 完成 了 语法 分 析 。 口 
一 个 左 递归 的 文法 会 使 它 的 递归 下 降 请 法 分 析 器 进入 一 个 无 限 循 环 。 即 使 是 带 回溯 的 语法 

分 析 器 也 是 如 此 。 a 当 我 们 试图 展开 一 个 非 终结 符号 4 的 时 候 , 我 们 可 能 会 没有 读 入 任 
何 输入 符号 就 再 次 试图 展开 
4.4.2 FIRST 和 FOLLOW 

自 顶 向 下 和 自 底 向 上 语法 分 析 器 的 构造 可 以 使 用 和 文法 G 相关 的 两 个 函数 FIRST 和 FOL- 
LOW 来 实现 。 在 自 顶 向 下 语法 分 析 过 程 中 ,FIRST 和 FOLLOW 使 得 我 们 可 以 根据 下 一 个 输入 符 
号 来 选择 应 用 哪个 产生 式 。 在 恐慌 模式 的 错误 恢复 中 , 由 FOLLOW 产生 的 词法 单元 集合 可 以 作 
为 同步 词法 单元 。 

FIRST(a ) 被 定义 为 可 从 a HESS BAY BAU AS E 
合 ,其 中 a 是 任意 的 文法 符号 申 。 如 果 a Se, 那么 < 也 在 P| J 
FIRST (a) 中 。 比 如 在 图 4-15 中 , A S cy, Alt c 在 YR 8 
FIRST(4) 中 。 

“我 们 先 简单 介绍 一 下 如 何在 预测 分 析 中 使 用 FIRST。 考 
虑 两 个 4 产生 式 4 一 a |B, 其 中 FIRST( a) #l FIRST(B) BA 
相交 的 集合 。 那 么 我 们 只 需要 查看 下 一 个 输入 符号 a, 就 可 
以 在 这 两 个 4 产生 式 中 进行 选择 。 因 为 a 只 能 出 现在 FIRST(a) 或 FIRST(B) 中 , 但 不 能 同时 出 现 
在 两 个 集合 中 。 比 如 , 如 果 a 在 FIRST(B8) 中 ,就 选择 4 一 8B。 在 4.4.3 中 定义 LL(1) 文 法 时 将 深入 
研究 这 个 思想 。 

对 于 非 终结 符号 4, FOLLOW(4) 被 定义 为 可 能 在 某 些 句 型 中 紧 跟 在 4 右边 的 终结 符号 的 集合 。 
也 就 是 说 , 如 果 存 在 如 图 4-15 所 示 形 如 5 SoAaB 的 推导 , 终结 符号 a 就 在 FOLLOW(4) 中 , 其 中 人 
和 B 是 文法 符号 串 。 请 注意 , 在 这 个 推导 的 某 个 阶段 ,4 Mo 之 间 可 能 存在 一 些 文法 符号 。 但 如 果 
这 样 , 这 些 符号 会 推导 得 到 e 并 消失 。 另 外 , 如 果 4 是 某 些 句 型 的 最 右 符号 , 那么 $ 也 在 
FOLLOW( 4) 中 。 回忆 一 下 ，$ 是 一 个 特殊 的 “结束 标记 ”符号 , 我 们 假设 它 不 是 任何 文法 的 符号 。 

计算 各 个 文法 符号 下 的 FIRST(Y) 时 ,不 断 应 用 下 列 规则 ,直到 再 没有 新 的 终结 符号 或 e 可 
以 被 加 入 到 任何 FIRST 集合 中 为 止 。 

1) 如 果 世 是 一 个 终结 符号 ,那么 FIRST(Y) = X. 

2) 如果 藉 是 一 个 非 终结 符号 , EAX nY, 是 一 个 产生 式 , HP kel, 那么 如 果 对 于 某 个 
i, a 在 FIRST(Y;) 中 且 @ ÆA HY FIRST(Y,) , FIRST Y3), +++, FIRST(Y;_,) P, 就 把 a 加 入 到 
FIRST(X) F. CRtEVL,Y)--Y;.; Se. MR FAW =1,2, ++, ,在 FIRST(Y;) 中 , 那么 
将 e 加 入 到 FIRST(X) 中 。 比 如 ,六 RST(Y) 中 的 所 有 符号 一 定 在 FIRST(X) 中 。 如 果 了 | 不 能 推 
导出 e, 那么 我 们 就 不 会 再 向 FIRST(X) 中 加 入 任何 符号 , (AWRY, Se, 那么 我 们 就 加 上 
FIRST(Y,), 依 此 类 推 。 

3) 如 果 Xe 是 一 个 产生 式 , 那么 将 e 加 入 到 FIRST) F. 

现在 ,我 们 可 以 按照 如 下 方式 计算 任何 串 半 Xo…X, 的 FIRST 集合 。 向 FIRST (X,X,°--X,) dM 
人 (Xi) 中 所 有 的 非 e 符 号 。 如 果 e 在 FIRST(X) 中 , 再 加 入 FIRST(X,) 中 的 所 有 非 e 符号; 如 
果 e 在 FIRST(XI) 和 FIRST(X,) 中 , 加 入 FIRST(X,) 中 的 所 有 非 符号, 依 此 类 推 。 最 后 ， 如果 
对 所 有 的 i, © 都 在 FIRST(X;) 中 , 那么 将 e 加 入 到 FIRST(X, XXa) 中 。 

计算 所 有 非 终 结 符号 4 的 FOLLOW(4) 集 合 时 , 不 断 应 用 下 面 的 规则 ,直到 再 没有 新 的 终结 











图 4-15 AGR c 在 FIRST(4) 
中 且 a 在 FOLLOW(4) 中 
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符号 可 以 被 加 入 到 任意 FOLLOW 集合 中 为 止 。 

1) 将 $ 放 到 FOLLOW(5) 中 , 其 中 5 是 开始 符号 , 而 $ 是 输入 右 端 的 结束 标记 。 

2) 如 果 存 在 一 个 产生 式 A> oBB, 那么 FIRST (8) 中 除 e 之 外 的 所 有 符号 都 在 
FOLLOW(B) 中 。 

3) 如 果 存 在 一 个 产生 式 4 一 aB，, 或 存在 产生 式 4 一 aBB A FIRST(B) 包 含 e， MA 
FOLLOW(4) 中 的 所 有 符号 都 在 FOLLOW(B) 中 。 

PESU 再 次 考虑 非 左 递 归 的 文法 (4. 28). WA: 

1) FIRST( F) =FIRST(T) aE = ={(, id| 。 要 知道 为 什么 , 请 注意 下 的 两 个 产生 式 的 
体 以 终结 符号 id 和 左 括号 开头 。7 只 有 一 个 产生 式 ， 而 该 生 式 的 体 以 下 开 头 。 又 因为 入 不 能 
推导 出 e, 所 以 FIRST(7) 必然 和 FIRST(E) 相 同 。 对 于 FIRST(E) 也 可 以 做 同样 的 论证 。 

2) FIRST(E’) =| +,e|。 理 由 是 的 两 个 产生 式 中 ,一 个 产生 式 的 体 以 终结 符号 + 开头 ， 
且 另 一 个 产生 式 的 体 为 se。 只 要 一 个 非 终 结 符号 推导 出 e, 我 们 就 会 把 e 放 到 该 终结 符号 的 FIRST 
集合 中 。 

3) FIRST(T') =| *, el。 它 的 论证 过 程 和 IRST(E') 的 论证 过 程 类 似 。 

4) FOLLOW(E) = FOLLOW(E’) = | )，$ 1。 因为 是 开始 符号 , FOLLOW(E) 一 定 包含 
$o FERS (E) 说 明了 右 插 号 为 什么 在 FOLLOW(E) 中 。 对 于 EB', 请 注意 这 个 非 终 结 符号 只 
出 现在 产生 式 的 体 的 尾部 ,因此 FOLLOW(E') 必 然 和 FOLLOW(E) 相 同 。 

5) FOLLOW(T) =FOLLOW(7T') = {+ ，)，$ 1。 请 注意 ,T 在 产生 式 体 中 出 现时 只 有 E' 跟 在 
后 面 。 因 此 , FIRST(£’) PR e 之 外 的 所 有 符号 一 定 都 在 FOLLOW(7T) 中。 这 解释 了 + 出 现在 
FOLLOW (T) 中 的 原因 。 然 而 , AN FIRST(E') @& e( Bl EF’), HEDER E PERRA PRR 
在 了 后 面 的 全 部 符号 , Alt FOLLOW(E) 中 的 所 有 符号 都 在 FOLLOW(7T) 中。 这 解释 了 符号 $ 和 
右 括 号 出 现在 FOLLOW(T) PHRA., EFT, 因为 它 只 出 现在 7 了 产生 式 的 尾部 , 因此 必然 有 
FOLLOW( T’) = FOLLOW( T), 

6) FOLLOW(F) = 1+，* ，)，$ | 。 论 证 过 程 和 第 5 点 中 对 7 了 的 论证 过 程 类 似 。 口 




















4.4.3 LL(1) 文 法 


对 于 称 为 oe 我 们 可 以 构造 出 预测 分 析 器 ， 妈 不 需要 回 滴 的 递 妇 下 降 语 cai 
器 。LL(1) 中 的 第 一 个 ” 工 ”表示 从 左 向 右 扫 描 输 入 , 第 二 个 “L” 表 示 产 生 最 左 推导 , 而 “1” 则 
ee 青 法 分 析 动 作 。 








预测 分 析 器 的 转换 图 

转换 图 有 助 于 将 预测 分 析 器 可 视 化 。 比 如 ,图 4-16a 中 显示 了 文法 (4.28 ) 中 非 终结 符号 五 
和 EE’ 的 转换 图 。 要 构造 一 个 文法 的 转换 图 ,首先 要 消除 左 递归 ,然后 对 文法 提取 左 公 因子 。 然 
后 对 每 个 非 终 结 符号 A: 

1) 创建 一 个 初始 状态 和 一 个 结束 (返回 ) 状 态 。 

2) 对 于 每 个 产生 式 4 一 X,X,- 区 创建 一 个 从 初始 状态 到 结束 状态 的 路 径 , 路 径 中 各 条 
ARSA XiXe Xo WMR 4 一 e, 那 么 这 条 路 径 就 是 一 条 标号 为 e 的 边 。 

预测 分 析 器 的 转换 图 和 词法 分 析 器 的 转换 图 是 不 同 的 。 分 析 器 的 转换 图 对 每 个 非 终结 符 
号 都 有 一 个 图 。 图 中 边 的 标号 可 以 是 词法 单元 ,也 可 以 是 非 终 结 祭 号。 词法 单元 上 的 转换 表 
示 当 该 词法 单元 是 下 一 个 输入 符号 时 我 们 应 该 执行 这 个 转换 。 非 . .. “符号 4 上 的 转换 表示 对 | 
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A 的 过 程 的 一 次 调用 。 
对 于 一 个 LL(I) 文 法 ,将 se 边 作 为 默认 选择 可 以 解决 是 否 选择 一 个 se 边 的 二 义 性 问题 。 
转换 图 可 以 化 简 ,前 提 是 各 条 路 径 上 的 文法 符号 序列 必须 保持 不 变 。 我 们 也 可 以 将 一 条 

标号 为 非 终 结 符号 4 的 边 蔡 换 为 4 的 转换 图 。 图 4-16a 和 图 4-16b 中 的 转换 图 是 等 价 的 :如 果 

我 们 跟踪 从 到 结束 状态 的 路 径 , 并 替换 E 那 么 在 这 两 组 图 中 , 沿 着 这 些 路 径 的 文法 符号 都 

组 成 了 形 如 T+7T+…+7 了 的 串 。 图 4-16b 中 的 图 可 以 从 图 4-16a 通过 转换 而 得 到 。 转 换 的 方 

法 类 似 于 2. 5. 4 节 所 述 的 方法 。 在 该 节 中 ,我们 使 用 尾 递归 消除 和 过 程 体 蔡 代 的 方法 来 优化 

一 个 非 终结 符号 的 相应 过 程 。 








LL(1) 文 法 已 经 足以 描述 大 部 分 程序 设计 语言 构造 , 虽然 在 为 源 语言 设计 适当 的 文法 时 需要 





多 加 小 心 。 比 如 , 左 递归 的 文法 和 二 Gy 
义 性 的 文法 都 不 可 能 是 LL(1) 的 。 l £: 3 一 ~ 人 @ 
一 个 文法 6 是 IL(1) 的 , HAR r: OOOO CO ~~ 
4G 的 任意 两 个 不 同 的 产生 式 < 
Aa | 8 满足 下 面 的 条 件 : a) 7 b) 
1) 不 存在 终结 符号 a 使 得 a 和 8B 图 4-16 文法 4 28 的 非 终结 符 号 五 和 已 的 转换 图 
都 能 够 推导 出 以 a 开头 的 串 。 


2) a 和 8B 中 最 多 只 有 一 个 可 以 推导 出 空 串 。 

3) WR Be, 那么 &a 不 能 推导 出 任何 以 FOLLOW(4) 中 某 个 终结 符号 开头 的 串 。 类 似 地 ， 
如 果 a Se, 那么 B 不 能 推导 出 任何 以 FOLLOW(4) 中 某 个 终结 符号 开头 的 串 。 

前 两 个 条 件 等 价 于 说 FIRST(a) 和 FIRST) 是 不 相交 的 集合 。 第 三 个 条 件 等 价 于 说 如 果 e 
在 FIRST(8) 中 , 那么 FIRST(a) 和 FOLLOW(4) 是 不 相交 的 集合 , 并 且 当 @ 在 FIRST(&) 中 时 类 似 
结论 成 立 。 

之 所 以 能 够 为 LL(1) 文法 构造 预测 分 析 器 ,原因 是 只 需要 检查 当前 输 和 人 符号 就 可 以 为 一 个 
非 终结 符号 选择 正确 的 产生 式 。 因 为 有 关 控 制 流 的 各 个 语言 构造 带 有 不 同 的 关键 字 , 它们 通常 
满足 LL(1) 的 约束 。 比 如 ， 如果 我 们 有 如 下 产生 式 

stmt —if (expr) stmt else stmt 
| while (expr) stmt , 
| | stmt_list | 

那么 关键 字 if, while 和 符号 { 告 诉 我 们 : 如 果 在 输入 中 找到 一 个 语句 ,哪个 产生 式 是 唯一 可 能 匹 
配 成 功 的 。 

接 下 来 给 出 的 算法 把 FIRST 和 FOLLOW 集合 中 的 信息 放 到 一 个 预测 分 析 表 MLA, a] 中。 这 
是 一 个 二 维 数组 ,其 中 4 是 一 个 非 终 结 符号 ,a 是 一 个 终结 符号 或 特殊 符号 $ ， 即 输入 的 结束 标 
记 。 该 算法 基于 如 下 的 思想 : 只 有 当下 一 个 输入 符号 在 FIRST(a ) 中 时 才 选 择 产 生 式 Aa, R 
有 当 ac =e 时 , 或 更 加 一 般 化 的 a 帮 e 时 , 情况 才 有 些 复杂 。 在 这 种 情况 下 , 如 果 当 前 输入 符号 在 
FOLLOW(4) 中 ,或 者 已 经 到 达 输入 中 的 $ 符号 且 $ 在 FOLLOW(4) 中 , 那么 我 们 仍 应 该 先 
择 4 一 a。 





构造 一 个 预测 分 析 表 。 
输入 : 文法 Go 
输出 : 预测 分 析 表 以 。 
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方法 : 对 于 文法 C 的 每 个 产生 式 Aa, 进行 如 下 处 理 : 

1) 对 于 人 IRST(a) 中 的 每 个 终结 符号 a, 将 4 一 加 入 到 M[ 4, aj] 中 。 

2) 如 果 e 在 FIRST(a) 中, 那么 对 于 FOLLOW(4) 中 的 每 个 终结 符号 六 将 4 一 a 加 入 到 
M[A, 65 中。 如 果 e 在 FIRST(a) 中 , A$ Ze FOLLOW( 4), 也 将 4 一 a MARI MUA, 8 ] 中 。 

在 完成 上 面 的 操作 之 后 ， 如果 MLA, a] 中 没有 产生 式 , WAK MLA, a] 设 置 为 error( 我 们 通 
常 在 表 中 用 一 个 空 条 目 表 示 ) 。 
对 于 表达 式 文 法 (4.28) , 算法 4.31 生成 了 图 4-17 中 的 预测 分 析 表 。 空 白条 目 表 示 错 
RREA; 非 空白 的 条 目 中 指明 了 应 该 用 其 中 的 产生 趟 来 扩展 相应 的 非 终结 符 号 。 
































非 终结 符号 mats i š 
id + * ( ) $ 
E ESTE E ESTE’ 
E E' 一 +TE' 五 se¢|E >e 
1 T+ FT T > FT 
T T>e (T > EFT T >| oe 
1 F>id an P(E) | 














图 4-17 fi 4. 32 的 预测 分 析 表 M 


考虑 产生 式 E 一 TE'。 因 为 
FIRST( TE’) = FIRST(T) = {(, id} 

这 个 产生 式 被 加 到 WM[E, (] 和 MM[E, id] 中 。 因 为 IRST( + TE’) =| +), PÆRE + TE' 被 加 
人 和信 到 M[E'，+ ] 中。 因为 FOLLOW(E') =|), $}, 产生 式 E' 一 e 被 加 入 到 MLL’, IA 
MLE, $ ] 中 。 口 

算法 4.31 可 以 应 用 于 任何 文法 C, 生成 该 文法 的 语法 分 析 表 M。 对 于 每 个 LL(I) 文 法 ,分 析 
表 中 的 每 个 条 目 都 唯一 地 指定 了 一 个 产生 式 , 或 者 标明 一 个 语法 错误 。 然 而 , 对 于 某 些 文法 ，M 
中 可 能 会 有 一 些 多 重 定义 的 条 自 。 比 如 , WE C 是 左 递归 的 或 二 义 性 的 , RAM 至 少 会 包含 一 
个 多 重 定义 的 和 条目。 虽然 可 以 轻松 对 其 进行 消除 左 递 归 和 提取 左 公 因子 的 操作 , 但 是 仍然 存在 
一 些 这 样 的 文法 ,它们 不 存在 等 价 的 LL(1) 文 法 。 

下 面 例子 中 的 语言 根本 没有 相应 的 LL(1) 文 法 。 
下 面 重复 一 下 例子 4. 22 中 的 文法 。 该 文法 抽象 地 表示 了 悬空 else 的 问题 。 

S—iktSS' | a 























S 一 6e9 le 
Eb 
这 个 文法 的 语法 分 析 表 显示 在 图 4-18 R, MUS, e] 的 条 日 同时 包含 了 S’ eS 和 S'e, 
非 终结 符号 MATES 
bares Q b e i t $ 
S S>a So iEtSS' 
J Se Pan 
H ° S' 一 eS 
E Bob 





























图 4-18 $i) 4.33 的 分 析 表 M 
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这 个 文法 是 二 义 性 的 。 当 在 输入 中 看 到 e( 代 表 else) NY, 解决 选择 使 用 哪个 产生 式 的 问题 就 
会 显露 出 此 文法 的 二 义 性 。 解 决 这 个 二 义 性 问题 时 , 我 们 可 以 选择 产生 式 $ 一 e$。 这 个 选择 就 相 
当 于 把 else 和 前 面 最 近 的 then 关联 起 来 。 请 注意 ,选择 S 一 e 将 使 得 永远 不 可 能 被 放 到 栈 中 或 
者 从 输入 中 被 消除 , 因此 选择 这 个 产生 式 一 定 是 错误 的 。 口 
4.4.4 非 递 归 的 预测 分 析 
我 们 可 以 构造 出 一 个 非 递 妇 的 预测 分 析 器 , 它 显 式 地 维护 一 个 栈 结构 , 而 不 是 通过 递归 调用 
的 方式 隐 式 地 维护 栈 。 这 样 的 语法 分 析 器 可 以 模拟 最 左 推导 的 过 程 。 如 果 w 是 至 今 为 止 已 经 匹 
配 完 成 的 输入 部 分 , 那么 栈 中 保存 的 文法 符号 序列 a 满足 


























T A [| |] | Tel+[ols] 
图 4-19 中 的 由 分 析 表 驱动 的 语法 分 析 器 有 一 a; 
个 输入 缓冲 区 , 一 个 包含 了 文法 符号 序列 的 栈 ， 内 | maon | ey 
一 个 由 算法 4.31 构造 得 到 的 分 析 表 , 以 及 一 个 输 Bs Li 
出 流 。 它 的 输入 缓冲 区 中 包含 要 进行 语法 分 析 的 saat 
串 ， 串 后 面 跟 有 结束 标记 8 。 我 们 复 用 符号 $ 来 pene 
标记 栈 底 。 在 开始 时 刻 , RE S 的 上 方 是 开始 符 -一 
号 So 图 4-19 ”一 个 分 析 表 驱动 的 预测 分 析 器 的 模型 
语法 分 析 器 由 一 个 程序 控制 。 该 程序 考虑 
栈 顶 符号 不 和 当前 输入 符号 a。 如 果 久 是 一 个 非 终结 符号 , 该 分 析 器 查询 分 析 表 M 中 的 条 目 


MIX, a KERA APER, 这 里 可 以 执行 一 些 附加 的 代码 ， 比 如 构造 一 个 语法 分 析 树 结 点 
的 代码 。) 否则 , 它 检查 终结 符号 忒 和 当前 输入 符号 a ESLER. 
这 个 语法 分 析 器 的 行为 可 以 使 用 它 的 格局 (configuration) 来 描述 。 格 局 描述 了 栈 中 的 内 容积 
余下 的 输入 。 下 面 的 算法 描述 了 如 何 处 理 格局 。 
3k 4.34 Te 未 了 驱动 的 预测 语法 分 析 。 
BA: 一 个 串 w, 文法 6 的 预测 分 析 表 Mo 
输出 : WR w ELP, 输出 w 的 一 个 最 左 推导 ; 否则 给 出 一 个 错误 指示 。 
方法 :最 初 , 语法 分 析 器 的 格局 如 下 : 输入 缓冲 区 中 是 w$ ,而 6 的 开始 符号 $ 位 于 栈 顶 ， 它 
的 下 面 是 $ 。 图 4-20 中 的 程序 使 用 预测 分 析 表 M 生成 了 处 理 这 个 输入 的 预测 分 析 过 程 。 J 
RR ip FECHA WNB—THS , Ht ip Bin ATE: 
& X= 栈 顶 符号 ; 
while (X48) { /* B4bgs */ 
if ( X SET ip PAREIS a) 执行 栈 的 弹出 操作 , 将 亡 向 前 移动 一 个 位 置 ; 
else if ( 六 是 一 个 终结 符号 error(); 
else if ( Af[X,a] 是 一 个 报错 条 目 error(); 
else if ( MIX,a] = X > Y1Y2 -Yk ) { 
MEERY > NPF 


弹出 栈 顶 符号 ; ners 
JF Yp, Yea Fi 压 入 栈 中 ,其 中 位 于 栈 顶 。 








} 
& X= 栈 顶 符号 ; 





图 4-20 ”预测 分 析 算 法 





AKER 考虑 文法 (4.28)。 我 们 已 经 在 图 4-17 中 看 到 了 它 的 预测 分 析 表 。 处 理 输入 id + id * id 





BED she 








时 , 算法 4 34 的 非 递归 预测 分 析 器 顺序 执行 图 4-21 中 显示 的 各 个 步 又 。 这 些 步骤 对 应 于 -个 最 














左 推 导 ( 完 整 的 推导 过 程 见 图 4-12 ) : 
已 匹配 栈 输入 动作 
Es id+id+id$ 
TB id+idxid8 输出 ETE’ 
FT'E'S id+id*id$ 输出 T> FT! 
id T'E'S id+id+id$ 输出 F id 
id TIES +idxidg 匹配 id 
id E'$ +idxid$ y Toe 
id +TE'$  +idsid$ 输出 E 4+ TE 
id + TE'$ idxid$ 匹配 + 
id + FT'E'$ id#id$ 输出 T> FT’ 
id + . id TIE'S idxid$ 输出 F> id 
id+id T'E'S *id$ ”匹配 id 
id +id * FT'E'S *id$ 输出 T> PT" 
id + id = FT'E'$ id8 ERR + 
id+id* id T'E’S idg ”输出 F> id 
‘id + id #id T'E'S $ EE id 
id +id *id E's . $ 输出 T'e 
id +id*id $ $ 输出 Ee 











图 4-21 对 输入 ia + id* id 进行 预测 分 析 时 执行 的 步骤 





E> T E'= F T'E'= id T E'=> id E’= id + T E's 

请 注意 ,这 个 推导 中 的 各 个 名 型 对 应 于 已 经 被 匹配 的 输入 部 分 ( 见 图 中 的 已 匹配 列 ) 加 上 楼 中 
的 内 容 。 我 们 显示 已 匹配 输入 就 是 为 了 强调 这 种 对 应 关系 。 因 为 同样 的 原因 , 在 图 中 将 栈 顶 显 
示 在 左边 。 当 我 们 考虑 自 底 向 上 语法 分 析 时 ,将 栈 顶 显示 在 右边 会 更 加 自然 。 分 析 器 的 输入 指针 
指向 “输入 ” 列 中 的 串 的 最 左边 的 符号 。 口 
4.4.5 预测 分 析 中 的 错误 恢复 

在 讨论 错误 恢复 时 要 考虑 一 个 由 分 析 表 驱动 的 预测 分 析 器 的 栈 , 因为 这 个 栈 明确 地 显示 了 
语法 分 析 器 期 望 用 哪些 终结 符号 及 非 终 结 符号 来 匹配 余下 的 输入 。 这 个 技术 也 可 以 在 递归 下 降 
语法 分 析 过 程 中 使 用 。 

当 栈 项 的 终结 符号 和 下 一 个 输入 符号 不 匹配 时 , 或 者 当 非 终结 符号 4 处 于 栈 顶 , a 是 下 一 个 
输入 符号 , A M[4, a] 为 error( 即 相应 的 语法 分 析 表 条 目 为 空 ) 时， 预测 语法 分 析 过 程 就 可 以 检 
测 到 语法 错误 。 

恐慌 模式 

尿 慌 模式 的 错误 恢复 是 基于 下 面 的 思想 。 语 法 分 析 器 忽略 输入 中 的 一 些 符号 , 直到 输入 中 
出 现 由 设计 者 选 定 的 同步 词法 单元 集合 中 的 某 个 词法 单元 。 它 的 有 效 性 依赖 于 同步 集合 的 选取 。 
选取 这 个 集合 的 原则 是 应 该 使 得 语法 分 析 器 能 够 从 实践 中 可 能 遇 到 的 错误 中 快速 恢复 。 下 面 是 
一 些 启发 式 规则 : 

1) 首先 将 FOLLOW(4) 中 的 所 有 符号 都 放 到 非 终结 符号 4 的 同步 集合 中 。 如 果 我 们 不 断 忽 
略 一 些 词法 单元 , 直到 磁 到 了 FOLLOW(4) 中 的 某 个 元 素 , 然后 再 将 4 从 栈 中 弹出 , 那么 很 可 能 
语法 分 析 过 程 就 能 够 继续 进行 。 

2) 只 使 用 FOLLOW(4) 作 为 4 的 同步 集合 是 不 够 的 。 比 如 ，C 语言 用 分 号 表示 一 个 语句 结 
R, 那么 语句 开头 的 关键 字 可 能 不 会 出 现在 代表 表达 式 的 非 终结 符号 的 FOLLOW 集合 中 。 因 此 ， 
在 一 个 赋值 语句 之 后 遗漏 分 号 可 能 会 使 得 语法 分 析 器 忽略 下 一 个 语句 开头 的 关键 字 。 一 个 语言 
的 各 个 构造 之 间 常 常 存在 某 个 层次 结构 。 比 如 ,表达 式 出 现在 语句 内 部 ， 而 语句 出 现在 块 内 部 ， 
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等 等 。 我 们 可 以 把 较 高 层 构造 的 开始 符号 加 入 到 较 低层 构造 的 同步 集合 中 去 。 比 如 , 我 们 可 以 
把 语句 开头 的 关键 字 加 入 到 生成 表达 式 的 非 终结 符号 的 同步 集合 中 去 。 

3) 如 果 我 们 把 FIRST(4) 中 的 符号 加 入 到 非 终结 符号 4 的 同步 集合 中 , 那么 当 FIRST(4) 中 
的 某 个 符号 出 现在 输入 中 时 , 我 们 就 有 可 能 可 以 根据 4 继续 进行 语法 分 析 。 

4) 如 果 一 个 非 终 结 符号 可 以 生成 空 串 , 那么 可 以 把 推导 出 e 的 产生 式 当 作 默 认 值 使 用 。 这 
么 做 可 能 会 延迟 对 某 些 错误 的 检测 , 但 是 不 会 使 错误 被 漏 检 。 这 个 方法 可 以 减少 我 们 在 处 理 错 
误 恢 复 时 需要 考虑 的 非 终结 符号 的 数量 。 

5) 如 果 栈 顶 的 一 个 终结 符号 不 能 和 输入 匹配 , 一 个 简单 的 想法 是 将 该 终结 符号 弹出 栈 , 并 

发 出 一 个 消息 称 已 经 插入 了 这 个 终结 符号 ,同时 继续 进行 语法 分 析 。 从 效果 上 看 ,这 个 方法 是 将 
所 有 其 他 词法 单元 的 集合 作为 一 个 词法 单元 的 同步 集合 。 
当 按照 常用 的 表达 式 文法 (4. 28) 对 表达 式 进行 语法 分 析 时 , 使 用 FIRST 和 FOLLOW 
符号 作为 同步 集合 就 能 够 很 好 地 完成 任务 。 图 4-17 中 此 文法 的 语法 分 析 表 在 图 422 中 再 次 给 
出 。 图 4-22 中 使 用 “synch” 来 表示 根据 相应 非 终结 符号 的 FOLLOW 集合 得 到 的 同步 词法 单元 。 
各 个 非 终 结 符号 的 FOLLOW 集合 是 从 例子 4. 30 中 得 到 的 。 

图 4-22 中 的 分 析 表 将 按照 如 下 方式 使 用 。 如 果 语 法 分 析 器 查看 MUA, a] 并 发 现 它 是 空 的 ， 
那么 输入 符号 a 就 被 忽略 。 如 果 该 条 目 是 “synch”, 那么 在 试图 继续 分 析 时 , 栈 顶 的 非 终 结 符号 
被 弹出 。 如 果 栈 项 的 词法 单元 和 输入 符号 不 匹配 , 那么 我 们 就 按 上 述 方式 从 栈 中 弹出 这 个 单元 。 









































非 终 结 符号 MAE, z 
id * $ 
E E = TE' | synch | synch 
E' E'3 +TE' EmelE ne 
T T > FT' synch T + FT' | synch | synch 
T T'e |T > FT 
F | F- id | synch synch | F — (E) | synch | synch 











图 4-22 加 入 到 图 4-17 的 预测 分 析 表 中 的 同步 词法 单元 











对 于 错误 输入 + 这 ”+ id, 语法 分 析 器 以 及 z T T 
图 4-22 中 的 错误 恢复 机 制 的 工作 过 程 如 图 4-23 所 ES +id*+idS 错误 ， 赂 过 】 
ee E$ id*+id$ id 4: FIRST(E) 
Ms 0 TE'$ ide+id$ 





LRM FRAKES | FT'E'$ idx+ias 
id T'E'$ id+#+id$ 


虑 有 关 错误 消息 的 重要 问题 。 编 译 器 的 设计 者 必 | “res “LTS 
须 提供 足够 的 包含 有 用 信息 的 错误 消息 , 它 不 仅 | FTE'S  *+id$ 














措 述 相应 的 错误 , 还 必须 引导 人 们 注意 错误 被 发 “Pes tas FERWER 
mens. E 
短语 层次 的 恢复 TE'$ id $ 
短语 层次 错误 恢复 的 实现 方法 是 在 预测 语法 | PTET 
分 析 表 的 空白 条 目 中 填写 指向 处 理 例 程 的 指针 。 | TES $ 
这 些 例 程 可 以 改变 、 插 入 或 删除 输入 中 的 符号 ， ; 
并 发 出 适当 的 错误 消息 。 它 们 也 可 能 执行 一 些 出 
栈 操作 。 改 变 栈 中 符号 或 将 新 符号 压 人 栈 中 可 能 图 4-23 一 个 预测 分 析 器 所 做 的 


会 引起 一 些 问 题 , 其 原因 有 多 个 。 首 先 ， 由 语法 语法 分 析 和 错误 恢复 步 台 
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分 析 器 执行 的 动作 可 能 根本 不 对 应 于 语言 中 任何 句子 的 推导 过 程 。 第 二 , 我 们 必须 保证 分 析 器 
不 会 陷 人 无 限 循 环 。 防 止 出 现 无 限 循环 的 一 个 好 办 法 是 保证 任何 恢复 动作 最 终 都 会 消耗 掉 某 个 
输入 符号 ( 当 到 达 输 入 结尾 处 时 , 则 需要 保证 栈 中 的 内 容 会 变 少 ) 。 
4.4.6 4.4 节 的 练习 

练习 4. 4.1: 为 下 面 的 每 一 个 文法 设计 一 个 预测 分 析 器 ,并 给 出 预测 分 析 表 。 你 可 能 先 要 对 
文法 进行 提取 左 公 因子 或 消除 左 递归 的 操作 。 

1) 练习 4.2.2(1) 中 的 文法 。 

2) 练习 4.2.2(2) 中 的 文法 。 

3) 练习 4.2.2(3) 中 的 文法 。 

4) 练习 4.2.2(4) 中 的 文法 。 

5) 练习 4.2.2(5) 中 的 文法 。 

6) 练习 4.2.2(7) 中 的 文法 。 

1! 练习 4.4.2: 有 没有 可 能 通过 某 种 方法 修改 练习 4.2.1 中 的 文法 , 构造 出 一 个 与 该 练习 
中 的 语言 (运算 分 量 为 a 的 后 缀 表达 式 ) 对 应 的 预测 分 析 器 ? 

练习 4. 4.3: 计算 练习 4.2.1 的 文法 的 FIRST Fl FOLLOW 集合 。 

练习 4. 4. 4: 计算 练习 4.2.2 中 各 个 文法 的 FIRST 和 FOLLOW 集合 。 

练习 4. 4.5: 文法 S—aSa | aa 生成 了 所 有 由 a 组 成 的 长 度 为 偶数 的 串 。 我 们 可 以 为 这 个 文 
法 设计 一 个 带 回 湖 的 递归 下 降 分 析 器 。 如 果 我 们 选择 先 用 产生 式 Soa 展开 , 那么 我 们 只 能 识 
SAE aa。 因此 , 任何 合理 的 递归 下 降 分 析 器 将 首先 尝试 SaSao 

1) 说 明 这 个 递归 下 降 分 析 器 识别 输入 aa aaaa 和 aaaaaaaa, 但 是 识别 不 了 caaaaa。 

1) 2) 这 个 递归 下 降 分 析 器 识别 什么 样 的 语言 ? 

下 面 的 练习 是 构造 任意 文法 的 “Chomsky WA” HAHA, Chomsky 范式 将 在 练习 4. 4.8 
中 定义 。 

1 练习 4.4.6: 如 果 一 个 文法 没有 产生 式 体 为 的 产生 式 ( 称 为 e 产生 式 ), 那么 这 个 文法 就 
fhe FLAN, 
1) 给 出 一 个 算法 , 它 的 功能 是 把 任何 文法 转变 成 一 个 无 产生 式 的 生成 相同 语言 的 文法 ( 唯 
一 可 能 的 例外 是 空 串 一 一 没有 哪个 无 产生 式 的 文法 能 生成 e) 。 提 示 : 首先 找 出 所 有 可 能 为 空 
的 非 终 结 符号 。 非 终结 符号 可 能 为 空 是 指 它 ( 可 能 通过 很 长 的 推导 ) 生 成 eo 

2) 将 你 的 算法 应 用 于 文法 S—aSdS | bSaS | e。 

| 练习 4.4.7: 单产 生 式 (single production) 是 指 其 产生 式 体 为 单个 非 终 结 符号 的 产生 式 ， 即 
形 如 AB 的 产生 式 , 其 中 4、B 为 任意 的 非 终结 符号 。 

1) 给 出 一 个 算法 , 它 可 以 把 任何 文法 转变 成 一 个 生成 相同 语言 (唯一 可 能 的 例外 是 空 串 ) 
的 、 无 se 产生 式 、 无 单产 生 式 的 文法 。 提 示 : 首先 消除 e- 产 生 式 , 然后 找 出 所 有 满足 下 列 条 件 的 
非 终结 符号 对 4 AB, 存在 一 系列 单产 生 式 使 得 4 SB, 

2) 将 你 的 算法 应 用 于 4. 1. 2 节 的 算法 (4.1) 。 

3) 说 明 作 为 (1) 的 一 个 结果 , 我 们 可 以 把 一 个 文法 转变 为 一 个 没有 环 ( 即 对 某 个 非 终结 符号 
4 存在 一 步 或 多 步 的 推导 4 A) 的 等 价 文法 。 

1) 练习 4. 4.8: 如 果 一 个 文法 的 每 个 产生 式 要 么 形 如 4 一 BC, BAM Asa, KPA, BA 
C 是 非 终结 符号 , 而 a 是 终结 符号 , 那么 这 个 文法 就 称 为 Chomsky 范式 (Chomsky Normal Form, 
CNF) 文 法 。 说 明 如 何 将 任意 文法 转变 成 一 个 生成 相同 语言 (唯一 可 能 的 例外 是 空 串 一 一 没有 
CNF 文法 可 以 生成 e) 的 CNF 文法 。 

















148 R44 











! 练习 4. 4.9: 对 于 每 个 具有 上 下 文 无 关 文法 的 语言, 其 长 度 为 上 的 串 可 以 在 O(n?) 的 时 间 
内 完成 识别 。 完 成 这 种 识别 工作 的 一 个 简单 方法 称 为 Cocke-Younger-Kasami( CYK) 算 法 。 该 算法 
基于 动态 规划 技术 。 也 就 是 说 ,给 定 一 个 串 aa an 我 们 构造 出 一 个 nxn 的 表 7 了 使 得 Ty 是 可 
以 生成 子 串 aia; ,1…a; 的 非 终结 符号 的 集合 。 如 果 基 础 文法 是 CNF 的 ( 见 练习 4.4.8), 那么 只 要 
我 们 按照 正确 的 顺序 来 填 表 : 先 填 j -i 值 最 小 的 条 目 , 则 表 中 的 每 一 个 条 目 都 可 以 在 0(n) 时 间 
内 填写 完毕 。 给 出 一 个 能 够 正确 填写 这 个 表 的 条 目的 算法 , 并 说 明 你 的 算法 的 时 间 复 杂 度 为 
O(n?) 。 填 完 这 个 表 之 后 , 你 如 何 判 断 aaa, 是 否 在 这 个 语言 中 ? 

L 练习 4.4. 10: 说 明 我 们 如 何 能 够 在 填 好 练习 4.4.9 中 的 表 之 后 , 在 0(n) 时 间 内 获得 
alaa…an 对 应 的 一 棵 语法 分 析 树 ? 提示: 修改 练习 4.4.9 中 的 表 了, 使 得 对 于 表 的 每 个 条 目 TP 
的 每 个 非 终结 符号 A, 这 个 表 同 时 记录 了 其 他 条 目 中 的 哪 两 个 非 终 结 符号 组 成 的 对 偶 使 得 我 们 将 
A 放 到 Tj 中 。 

| 练习 4. 4. 11: 修改 练习 4.4.9 中 的 算法 , 使 得 对 于 任意 符号 捉 , 它 可 以 找 出 至 少 需 要 执行 
多 少 次 插入 、 删 除 和 修改 错误 (每 个 错误 是 一 个 字符 ) 的 操作 才能 将 这 个 串 变 成 基础 文法 的 语言 
的 句子 。 

! 练习 4. 4. 12: 图 4-24 中 给 出 了 对 应 于 某 些 语句 的 文法 。 你 可 以 将 e Als 当 作 分 别 代表 条 
件 表达 式 和 “其 他 语句 ”的 终结 符号 。 如 果 我 们 按照 下 列 方法 来 解决 因为 展开 可 选 “else”( 非 终 














结 符号 stmtTail) 而 引起 的 冲突 : 当 我 们 从 输入 中 看 到 一 个 stmt + if e then stmt stmtTail 
else 时 就 选择 消耗 掉 这 个 else。 使 用 4.4.5 节 中 描述 的 同 | while e do stmt 

E hh 田 相 begin list end 
步 符号 的 思想 : s 

1) 为 这 个 文法 构造 一 个 带 有 错误 纠正 信息 的 预测 分 stmtTail — else stmt 

€ 

HK o list — stmt list Tail 

2) 给 出 你 的 语法 分 析 器 在 处 理 下 列 输 入 时 的 行为 :| 下 e 

@) if e then s; if e then s end 

® while e do begin s ; if e then s ; end 图 4-24 某 种 类 型 语句 的 文法 


4.5 自 底 向 上 的 语法 分 析 


一 个 自 底 向 上 的 语法 分 析 过 程 对 应 于 为 一 个 输入 串 构 造 语法 分 析 树 的 过 程 , 它 从 叶子 结 点 
(底部 ) 开 始 逐 渐 向 上 到 达 根 结 点 ( 顶部 ) 。 将 语法 分 析 描述 为 语法 分 析 树 的 构造 过 程 会 比较 方 
便 , 虽然 编译 器 前 端 实际 上 不 会 显 式 地 构造 出 语法 分 析 树 , 而 是 直接 进行 翻译 。 图 4-25 中 显示 
的 分 析 树 的 快照 序列 演示 了 按照 表达 式 文法 (4. 1 ) 对 词法 单元 序列 id * id 进行 的 自 底 向 上 语法 
分 析 的 过 程 。 


id x id F x id T « id Tx F T E 
l | AN i 
id F id T+ F T 
| | | | JIN 
id id F id io 
id i id 
id 


图 4-25 id xid W9 AR LTE ， 

本 节 将 介绍 一 个 被 称 为 移 人 - 归 约 语法 分 析 的 自 底 向 上 语法 分 析 的 通用 框架 。 我 们 将 在 46 

节 和 4. 7 节 中 讨论 LR 文法 类 , 它 是 最 大 的 、 可 以 构造 出 相应 移 和 人 - 归 约 语法 分 析 器 的 文法 类 。 
虽然 手工 构造 一 个 LR 语法 分 析 器 的 工作 量 非 常 大 , 但 借助 语法 分 析 器 自动 生成 工具 可 以 使 人 们 
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轻松 地 根据 适当 的 文法 构造 出 高 效 的 LR 分 析 器 。 本 节 中 的 概念 有 助 于 写 出 合适 的 文法 ， 从 而 有 
效 利用 LR 分 析 器 生成 工具 。 实 现 语法 分 析 器 生成 工具 的 算法 将 在 4.7 节 中 给 出 。 
4.5.1 JAX 

我 们 可 以 将 自 底 向 上 语法 分 析 过 程 看 成 将 一 个 串 wo 归 约 ”为 文法 开始 符号 的 过 程 。 在 每 个 归 
44 (reduction ) 步 又 中 , 一 个 与 某 产 生 式 体 相 匹配 的 特定 子 串 被 蔡 换 为 该 产生 式 头 部 的 非 终结 符 号 。 

在 自 底 向 上 语法 分 析 过 程 中 , 关键 问题 是 何 时 进行 归 约 以 及 应 用 哪个 产生 式 进行 归 约 。 
E 4-25 中 的 快照 演示 了 一 个 归 约 序列 , 相应 的 文法 是 表达 式 文法 (4. 1) 。 我 们 将 使 用 
如 下 的 符号 串 序 列 来 讨论 这 个 归 约 过 程 ; 

| id « id, F * id,T x id,T* F,T,E 

这 个 序列 中 的 符号 串 由 快照 中 各 相应 子 树 的 根 结 点 组 成 。 这 个 序列 从 输入 串 id id 开始 。 
第 一 次 归 约 使 用 产生 式 Pid, 将 最 左边 的 id 归 约 为 下 , 得 到 串 « id, BORBAH FIAN 
T, ÆR T * id, 

现在 我 们 可 以 选择 是 对 串 7 还 是 对 由 第 二 个 id 组 成 的 串 进行 归 约 , p TE ESTA, 而 
第 二 个 id 是 Fid 的 体 。 我 们 没有 将 了 归 约 为 已, 而 是 将 第 二 个 id 4 F, BEIT = F。 然 
后 这 个 串 被 归 约 为 7。 最 后 将 了 归 约 为 开始 符号 ,从 而 结束 整个 语法 分 析 过 程 。 口 

根据 定义 ,一 次 归 约 是 一 个 推导 步骤 的 反 向 操作 (回顾 一 下 ,一 次 推导 步骤 将 句 型 中 的 -一 个 
非 终结 符号 替换 为 该 符号 的 某 个 产生 式 的 体 ) 。 因 此 , 自 底 向 上 语法 分 析 的 目标 是 反 向 构造 一 个 
推导 过 程 。 下 面 的 推导 对 应 于 图 4-25 中 的 分 析 过 程 : 

E=3T>T * F>T «id=oF *id=id * id 

这 个 推导 过 程 实际 上 是 -一 个 最 右 推导 。 
4.5.2 ‘ARBRE | 

对 输入 进行 从 左 到 右 的 扫描 , 并 在 扫描 过 程 中 进行 自 底 向 上 语法 分 析 , 就 可 以 反 向 构造 出 一 
个 最 右 推导 。 非 正式 地 讲 , “句柄 ”是 和 某 个 产生 式 体 匹配 的 子 串 ,对 它 的 归 约 代表 了 相应 的 最 
右 推导 中 的 一 个 反 向 步骤 。 

比如 , 在 按照 表达 式 文法 (4. 1) 对 id * id, 进行 语法 分 析 时 , 各 个 句柄 如 图 4-26 所 示 。 为 了 
表示 得 更 清楚 , RN HE PWIA id LT Fe. BA TEPER EST 的 体 , 但 符号 了 并 
不 是 句 型 T* id, 的 一 个 句柄 。 假 如 7 真 的 被 替换 为 5, RIISER E sidi, MXA ERREA 
始 符号 巨 推导 得 到 。 因 此 ， 和 某 个 产生 式 体 匹配 的 最 左 子 串 不 一 定 是 句柄 。 























正式 地 讲 ， 如 果 有 S > adw = ow (如 图 hana am | JRE AME 
4-27 所 示 ) , ABA TARR a 的 产生 式 4 一 68 是 oBw id) + idz idı F + id 

的 一 个 句柄 (handle)。 换 句 话 说 , 最 右 句 型 y | Pe ee Meme 

的 一 个 句柄 是 满足 下 述 条 件 的 产生 式 AB 及 | TF F |TST+F 





T E>T 
串 B 在 y 中 出 现 的 位 置 : IAEE pe 


换 为 4 之 后 得 到 的 串 是 y 的 某 个 最 右 推 导 序列 N 
ERUR 


中 出 现在 位 于 y 之 前 的 最 右 句 型 。 
WEE, 句柄 右边 的 事 w 一 定 只 包含 终结 符号 。 为 方便 起 见 , 我 们 把 产生 式 体 p 而 不 是 
4 一 B) 称 为 一 个 句柄 。 注 意 ,我 们 说 的 是 “一 个 句柄 ”， 而 不 是 “唯一 句柄 ”。 这 是 因为 文法 可 能 
是 二 义 性 的 , pu 可 能 存在 多 个 最 右 推导 。 如 果 一 个 文法 是 无 二 义 性 的 , 那么 该 文法 的 每 个 右 句 
型 都 有 且 只 有 一 个 句柄 。 
通过 “ 句 栖 剪 枝 ” 可 以 得 到 一 个 反 向 的 最 右 推导 。 也 就 是 说 , 我 们 从 被 分 析 的 终结 符号 串 w 
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开始 。 如 果 w 是 当前 文法 的 句子 , WAS wy, 其 中 y, 是 某 个 未 知 最 右 推导 的 第 n 个 最 右 
句 型 。 S 


= Yo mN m Y2 ie 2 Yn-1 Yn w Zo ES 
为 了 以 相反 顺序 重 构 这 个 推导 , 我 们 在 yn 中 寻找 句柄 6。 并 LA 


将 B, 替换 为 相关 产生 式 4 一 B, 的 头 部 ， 得 到 前 一 个 最 右 句 型 
7，i。 请 注意 ,我 们 现在 还 不 知道 如 何 发 现 句 柄 , 但 是 我 们 很 快 就 ”图 427 Bo 的 语法 分 析 
会 介绍 多 个 寻找 句柄 的 方法 。 树 中 的 一 个 句柄 AB 
然后 我 们 重复 这 个 过 程 。 也 就 是 说 , 我 们 在 y PIRIM B。; ， 并 对 这 个 句柄 进行 归 约 ， 
得 到 最 右 句 型 y, -2。 如 果 我 们 按照 这 个 过 程 得 到 了 一 个 只 包含 开始 符号 $ 的 最 右 句 型 , 那么 就 
可 以 停止 分 析 并 宣称 语法 分 析 过 程 成 功 完成 。 将 归 约 过 程 中 用 到 的 产生 式 反 向 排序 , 就 得 到 了 
输入 串 的 一 个 最 右 推导 过 程 。 
4.5.3 BA -~ 归 约 语法 分 析 技术 

移入 - 归 约 语法 分 析 是 自 底 向 上 语法 分 析 的 一 种 形式 。 它 使 用 一 个 栈 来 保存 文法 符号 , 并 
用 一 个 输入 缓冲 区 来 存放 将 要 进行 语法 分 析 的 其 余 符号 。 我 们 将 看 到 ,句柄 在 被 识别 之 前 ,总 是 
出 现在 栈 的 顶部 。 

我 们 使 用 $ 来 标记 栈 的 底部 以 及 输入 的 右 端 。 按 照 惯例 , 在 讨论 自 底 向 上 语法 分 析 的 时 候 ， 
我 们 将 栈 顶 显 示 在 右 侧 ， 而 不 是 像 在 自 顶 向 下 语法 分 析 中 那样 显示 在 左 侧 。 如 下 所 示 , 开始 的 时 
(ERB, HAMAR w 存放 在 输入 缓冲 区 中 。 

栈 RA 
$ w$ 

在 对 输入 串 的 一 次 从 左 到 右 扫描 过 程 中 , 语法 分 析 器 将 零 个 或 多 个 输入 符号 移 到 楼 的 顶端 ， 
直到 它 可 以 对 栈 顶 的 一 个 文法 符号 串 B 进行 归 约 为 止 。 它 将 6 归 约 为 某 个 产生 式 的 头 。 语 法 分 
析 器 不 断 地 重复 这 个 循环 , 直到 它 检 测 到 一 个 语法 错误 ,或 者 栈 中 包含 了 开始 符号 且 输入 缓冲 区 
为 空 为 止 : 























栈 -输入 
$5 $ 
当 进入 这 样 的 格局 时 ,语法 分 析 器 停止 运行 ,并 宣称 成 功 完成 了 语法 分 析 。 图 4.28 显示 了 
一 个 移入 - 归 约 语法 分 析 器 在 按照 表达 式 文法 (4.1) 对 输入 串 id, * id, 进行 语法 分 析 时 可 能 采 
取 的 动作 。 
虽然 主要 的 语法 分 析 操作 是 移 人 和 归 约 ,但 实际 上 一 个 移入 - 归 约 语法 分 析 器 可 采取 如 下 
四 种 可 能 的 动作 : OBA, QUA, OH, ORE. E 输入 动作 
1) 移入 (shift) :将 下 一 个 输入 符号 移 到 栈 的 | idı * idz$ BA 
顶端 。 $id; + id, $ 按照 F> id 归 约 
2) Ja £4 (reduce) ;被 归 约 的 符号 囊 的 右 端 必然 Sr i ae 
是 栈 顶 。 语 法 分 析 器 在 栈 中 确定 这 个 串 的 左 端 , 并 ira Oe aves 
决定 用 哪个 非 终结 符号 来 鞭 换 这 个 串 。 $T+F S 按照 TT + PIE 
3) 接受 (accept) :宣布 语法 分 析 过 程 成 功 完成 。 | $7 E 








4) 报错 (error) :发现 一 个 语法 错误 ,并 调用 一 
个 错误 恢复 子 例 程 。 图 4.28 一 个 移 人 - 归 约 语法 分 析 器 


我 们 之 所 以 能 够 在 移 人 - 归 约 语法 分 析 中 使 用 。 在 处 理 输入 id, «id, 时 经 历 的 格局 





“ay 
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R, 是 因为 这 个 分 析 过 程 具有 如 下 重要 性 质 ; 句柄 总 是 出 现在 栈 的 顶端 , 绝 不 会 出 现在 栈 的 中 





， 间 。 要 证 明 这 个 性 质 , 我 们 只 需要 考虑 任意 最 右 推 导 中 的 两 个 连续 步 又 可 能 具有 的 形式 。 图 4-29 





演示 了 两 种 可 能 的 情况 。 在 情况 (1) 中, ABERA BBy ,然后 产生 式 体 BBy 中 最 右 非 终结 符号 B 
被 替换 为 y。 在 情况 (2) 中 , 4 仍然 首先 被 s s, 
展开 , 但 这 次 使 用 的 产生 式 体 y 中 只 包含 终 5 2A 
结 符号 。 下 一 个 最 右 非 终结 符号 8 将 位 于 a AS 
y 左 侧 的 某 个 地 方 。 Soe Sa eee 
换 句 话说 : 情况 (D 情况 (2) 


1) S=adz =ropByz > aByyz 
2) S > aBicAz = aBxyz yyz 
反 向 考虑 情况 (1) ， 即 一 个 移 人 - 归 约 语法 分 析 器 刚刚 到 达 如 下 格局 的 情况 : 


图 4-29 一 个 最 右 推导 中 两 个 连续 步骤 的 两 种 情况 








a 输入 

$aßy yz $ 

语法 分 析 器 将 句柄 y 归 约 为 8B, 从 而 到 达 如 下 格局 : 
$aßB yz $ 

现在 ,语法 分 析 器 可 以 通过 零 次 或 多 次 移 人 动作 , By 移 人 到 栈 的 上 方 ,， 得 到 如 下 格局 : 
$aBBy z$ 


其 中 ,句柄 BBy 位 于 栈 顶 , 它 将 被 归 约 为 4。 
现在 考虑 情况 (2) 。 在 格局 
$ay xyz $ 
中 , 句柄 y 位 于 栈 顶 。 将 句柄 y 归 约 为 中 之 后 , TRE ATA TT LU xy BART, 得 到 位 于 栈 顶 
的 下 一 个 句柄 y。 该 句柄 可 以 被 归 约 为 4; 


$aBxy z$ 
在 这 两 种 情况 下 , 语法 分 析 器 在 进行 一 次 归 约 之 后 ,都 必须 接着 移 人 零 个 或 多 个 符号 才能 在 


栈 项 找到 下 一 个 句柄 。 因 此 它 从 不 需要 到 栈 中 间 去 寻找 句柄 。 
4.5.4 移入 - 归 约 语法 分 析 中 的 冲突 
有 些 上 下 文 无 关 文 法 不 能 使 用 移 人 - 归 约 语法 分 析 技 术 。 对 于 这 样 的 文法 ,每 个 移 和 人 - JA 
约 语法 分 析 器 都 会 得 到 如 下 的 格局 : 即使 知道 了 栈 中 的 所 有 内 容 以 及 接 下 来 的 上 个 输入 符号 , 我 
们 仍然 无 法 判断 应 该 进行 移 人 还 是 妇 约 操作 (移入 / 归 约 冲突 ) , 或 者 无 法 在 多 个 可 能 的 归 约 方法 
中 选择 正确 的 归 约 动作 ( 归 约 / 归 约 冲突 ) 。 现 在 我 们 给 出 一 些 语法 构造 的 例子 ,这 些 构造 的 文法 
可 能 会 出 现 这 样 的 冲突 。 从 技术 上 来 讲 , 这 些 文法 不 在 4.7 WEL LR ORES, 我 们 把 它 
们 称 为 非 LR 文法。LR(k) 中 的 表示 在 输入 中 向 前 看 个 符号 。 在 编译 中 使 用 的 文法 通常 属于 
LR(1) 文 法 类 , 即 最 多 只 和 需要 向 前 看 一 个 符号 。 
PEER 一 个 一 义 性 文法 不 可 能 是 LR 的 。 比 如 , 考虑 4 3 节 中 的 悬空 -else 文法 (4.14) ; 
stmt— if expr then stmt 
| if expr then stmt else stmt 
| other 


如 果 我 们 有 一 个 移 人 - 归 约 语法 分 析 器 处 于 格局 





栈 输入 
… if expr then simt else … $ 

中 , 那么 不 管 栈 中 if expr then sim 之 下 是 什么 内 容 , 我 们 都 不 能 确定 它 是 否 是 句柄 。 这 里 就 出 现 
了 一 个 移 人 / 归 约 冲突 。 根 据 输 入 中 else 之 后 的 内 容 的 不 同 , 可 能 应 该 将 if expr then simt 归 约 为 
stimt， 也 可 能 应 该 将 else 移 人 然后 再 寻找 另 一 个 stimt， 从 而 找到 完整 的 seme PERI if expr then 
stmt else stmt, 

请 注意 , 经 过 修正 的 移入 - 归 约 语法 分 析 技 术 可 以 对 某 些 二 义 性 文法 进行 语法 分 析 ， 比 如 上 
TW AY if-then-else 文法 。 如 果 我 们 在 碰 到 else 时 选择 移 人 来 解决 移 人 / 归 约 冲突 , 语法 分 析 器 就 会 
按照 我 们 的 期 望 运行 , 也 就 是 将 每 个 else 和 前 一 个 尚未 匹配 的 then 相关 联 。 我 们 将 在 4.8 Wit 


论 能 够 处 理 这 种 二 义 性 文法 的 语法 分 析 器 。 口 
另 一 个 常见 的 冲突 情况 发 生 在 我 们 确认 已 经 找到 句柄 的 时 候 。 在 这 种 情况 下 我 们 不 能 够 根 


据 栈 中 内 容 和 下 一 个 输入 符号 确定 应 该 使 用 哪个 产生 式 进 行 归 约 。 下 面 的 例子 说 明了 这 种 情况 。 
假设 我 们 有 这 样 一 个 词法 分 析 器 ,， 它 不 考虑 备 个 名 字 的 类 型 ,而 是 对 所 有 的 名 字 都 返 
回 词法 单元 名 id。 假 设 我 们 的 语言 在 调用 过 程 时 会 给 出 过 程 名 字 , 并 把 调用 参数 放 在 括号 内 。 并 
且 假 设 引用 数组 的 语法 与 此 相同 。 因 为 在 数组 引用 中 对 下 标的 翻译 不 同 于 过 程 调 用 中 对 参数 的 
翻译 , 我 们 希望 使 用 不 同 的 产生 式 分 别 生成 实在 参数 列表 和 下 标 列 表 。 因 此 , 我 们 的 文法 包含 了 

















a = 中 所 示 的 产 生 式 《还 包 会 其 他 (1) stmt — id ( parameter_list ) 
生 式 ) 。 (2) stmt — expr := expr 
Np z A y sag fay i |} 25] 9 (3) parameter_list —  parameter_list , parameter 
1 以 p( ta, J ) 开头 的 wra 将 以 ial 法 单 (4) parameter_list — parameter 
FEE id (id, id) 的 方式 输入 到 语法 分 析 器 中 。 | (5) parometer > id 
lee BR = paren (6) espr 一 id ( eapr_lst ) 
归 约 语法 分 析 器 将 处 于 如 下 格局 中 ， (8) expr_list — expr_list , expr 
i 输入 {9) expr_list — expr 
AE d sae) 图 4.30 ”有关 过 程 调用 和 数组 引用 的 产生 式 


显然 , 栈 顶 的 id 必须 被 归 约 , 但 使 用 哪个 产生 
A? WR p 是 一 个 过 程 , 那么 正确 的 选择 是 产生 式 (5); 但 如 果 p 是 一 个 数组 ,就 该 选择 产生 
式 (7)。 栈 中 的 内 容 并 没有 指出 p 是 什么 , 必须 使 用 从 p 的 声明 中 获得 的 符号 表 中 的 信息 来 
确定 。 

解决 方法 之 一 是 将 产生 式 (1) 中 的 词法 单元 id 改 成 procid, 并 使 用 一 个 更 加 复杂 的 词法 分 析 
器 。 该 词法 分 析 器 在 识别 到 一 个 过 程 名 字 的 词素 时 返回 词法 单元 名 procid。 这 就 要 求 词法 分 析 
器 在 返回 一 个 词法 单元 之 前 先 查 询 符号 表 。 

如 果 我 们 做 了 这 样 的 修改 , 那么 在 处 理 p(i, j ) 的 时 候 , 语法 分 析 器 要 么 进入 格局 

Èa 输入 
… procid ( id , id ) … 

要 么 进入 前 面 描述 的 格局 。 在 前 一 种 情况 下 , 我 们 选择 产生 式 (5 ) 进 行 归 约 ; 在 后 一 种 情况 下 , 则 
选择 产生 式 (7) 进 行 归 约 。 请 注意 , 在 这 个 例子 里 , 栈 顶 之 下 的 第 三 个 符号 决定 了 应 该 执行 什么 
归 约 ,虽然 它 本 身 并 没有 被 归 约 。 移 人 - 归 约 的 语法 分 析 技 术 可 以 使 用 栈 中 离 栈 顶 很 远 的 信息 
来 引导 语法 分 析 过 程 。 B 
4.5.5 4.5 节 的 练习 

练习 4. 5. 1: 对 于 练习 4. 2.2(a) 中 的 文法 SHO 51 101, 指出 下 面 各 个 最 右 句 型 的 句柄 : 








EER 153 





1) 000111 

2) 00S11 

练习 4.5.2: 对 于 练习 4.2.1 AXE SSS + ISS 1 a 和 下 面 各 个 最 右 句 型 , 重复 练 
习 4.5.1。 


1) SSSta* + 

2) SSta*at 

3) aaa * att 

练习 4. 5.3: MPF RAAT BANA, 说明 相 应 的 自 底 向 上 语法 分 析 过 程 。 
1) 练习 4.5.1 的 文法 的 串 000111, 

2) 练习 4.5.2 的 文法 的 串 aaa tatto 


4.6 上 LR 语法 分 析 技术 介绍 : 简单 LR 技术 


目前 最 流行 的 自 底 向 上 语法 分 析 器 都 基于 所 谓 的 LR(E) 语 法 分 析 的 概念 。 其 中 ,“L” 表 示 
对 输入 进行 从 左 到 右 的 扫描 ,“R” 表 示 反 向 构造 出 一 个 最 右 推 导 序列 ， 而 上 表示 在 做 出 语法 分 析 
决定 时 向 前 看 个 输入 符号 。k =0 和 =1 这 两 种 情况 具有 实践 意义 ,因此 这 里 我 们 将 只 考虑 
<1 的 情况 。 当 省 略 (如 时 ,我 们 假设 上 = 1。 

本 节 将 介绍 LR 语法 分 析 的 基本 概念 , 同时 还 将 介绍 最 简单 的 构造 移 人 - 归 约 语法 分 析 器 的 
方法 。 这 个 方法 称 为 “简单 LR BOR” (REH SLR), BA LR 语法 分 析 器 本 身 是 使 用 语法 分 
析 器 自动 生成 工具 构造 得 到 的 , 但 对 基本 概念 有 所 了 解 仍 然 是 有 益 的 。 我 们 首先 介绍 “项 ”和 
“语法 分 析 器 状态 ”的 概念 , 一 个 LR 语法 分 析 器 生成 工具 给 出 的 诊断 信息 通常 会 包含 语法 分 析 
器 状态 。 我 们 可 以 使 用 这 些 状态 分 离 出 语法 分 析 冲突 的 源头 。 

4.7 节 将 介绍 两 个 更 加 复杂 的 方法 规范 LR 和 LALR。 它 们 被 用 于 大 多 数 的 LR 语法 分 析 
器 中 。 

4.6.1 为 什么 使 用 LR 语法 分 析 器 
LR 语法 分 析 器 是 表格 驱动 的 , 在 这 一 点 上 它 和 4.4.4 节 中 提 到 的 非 递 归 LL 语法 分 析 器 很 相 
似 。 如 果 我 们 可 以 使 用 本 节 和 下 一 节 中 的 某 个 方法 为 一 个 文法 构造 出 语法 分 析 表 , 那么 这 个 文 
法 就 称 为 LR 文法 (LR grammar) 。 直 观 地 讲 ， 只 要 存在 这 样 一 个 从 左 到 右 扫描 的 移 人 - 归 约 语法 
分 析 器 , 它 总 是 能 够 在 某 文法 的 最 右 句 型 的 句柄 出 现在 栈 顶 时 识别 出 这 个 句柄 , 那么 这 个 文法 就 
是 LR 的。 
LR 语法 分 析 技 术 很 有 吸引 力 ,原因 如 下 : 
o 对 于 几乎 所 有 的 程序 设计 语言 构造 ,只 要 能 够 写 出 该 构造 的 上 下 文 无 关 文法 , 就 能 够 构 
造 出 识别 该 构造 的 LR 语法 分 析 器 。 确 实 存 在 非 LR 的 上 下 文 无 关 文 法 ,但 一 般 来 说 , 党 
见 的 程序 设计 语言 构造 都 可 以 避免 使 用 这 样 的 文法 。 

o LR 语法 分 析 方 法 是 已 知 的 最 通用 的 无 回溯 移 人 - 归 约 分 析 技 术 , 并 且 它 的 实现 可 以 和 其 
他 更 原始 的 移 人 - 归 约 方法 ( 见 参考 文献 ) 一 样 高 效 。 

o 一 个 LR 语法 分 析 器 可 以 在 对 输入 进行 从 左 到 右 扫 描 时 尽 可 能 早 地 检测 到 错误 。 

© 可 以 使 用 LR 方法 进行 语法 分 析 的 文法 类 是 可 以 使 用 预测 方法 或 LL 方法 进行 语法 分 析 的 
文法 类 的 真 超 集 。 一 个 文法 是 LR (k) 的 条 件 是 当 我 们 在 一 个 最 右 句 型 中 看 到 某 个 产生 式 
的 右 部 时 , 我 们 再 向 前 看 上 个 符号 就 可 以 决定 是 否 使 用 这 个 产生 式 进行 归 约 。 这 个 要 求 
比 LL(k) 文 法 的 要 求 宽 松 很 多 。 对 于 LLE, 我 们 在 决定 是 否 使 用 某 个 产生 式 时 ， 
只 能 向 前 看 该 产生 式 右 部 推导 出 的 串 的 前 个 符号 。 因 此 ,LR 文法 能 够 比 LL 文法 描述 
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更 多 的 语言 就 一 点 也 不 疝 怪 了 。 

LR 方法 的 主要 缺点 是 为 一 个 典型 的 程序 设计 语言 文法 手工 构造 LR 分 析 器 的 工作 量 非 常 大 。 
我 们 需要 一 个 特殊 的 工具 , 即 一 个 LR 语法 分 析 器 生成 工具 。 幸 运 的 是 ,有 很 多 这 样 的 生成 工具 
可 用 , 我 们 将 在 4.9 节 讨 论 其 中 最 常用 的 工具 Yacc。 这 种 生成 工具 将 一 个 上 下 文 无 关 文 法 作为 
输入 ， 自 动 生成 一 个 该 文法 的 语法 分 析 器 。 如 果 该 文法 含有 二 义 性 的 构造 , 或 者 含有 其 他 难以 在 
从 左 到 石 扫描 时 进行 语法 分 析 的 构造 , 那么 语法 分 析 器 生成 工具 将 对 这 些 构造 进行 定位 , 并 给 出 
详细 的 诊断 消息 。 
4.6.2 项 和 LR(0) 自 动机 

一 个 移入 - 归 约 语法 分 析 器 怎么 知道 何 时 进行 移入 、 何 时 进行 归 约 呢 ?” 比 如 ， 当 图 4-28 中 栈 
的 内 容 为 $ 了 而 下 一 个 输入 符号 是 * 时 , 语法 分 析 器 是 怎么 知道 位 于 栈 项 的 了 不 是 句柄 , 因此 正 
确 的 动作 是 移入 而 不 是 将 了 归 约 到 记 呢 ? 

一 个 LR 语法 分 析 器 通过 维护 一 些 状态 , 用 这 些 状态 来 表明 我 们 在 语法 分 析 过 程 中 所 处 的 位 
置 , 从 而 做 出 移入 - 归 约 决定 。 这 些 状 态 代 表 了 “项 ”(item) 的 集合 。 一 个 文法 6 的 一 个 LR(0) 
项 (简称 为 项 ) 是 6 的 一 个 产生 式 再 加 上 一 个 位 于 它 的 体 中 某 处 的 点 。 因 此 , 产生 式 4 一 XYZ 产 
生 了 下 个 项 : i 








A> + XYZ 
AX + YZ 
A>XY + Z 
A—>XYZ ， 
产生 式 4 一 e 只 生成 一 个 项 4 一 。 





项 集 的 表示 
一 个 生成 自 底 向 上 语法 分 析 器 的 生成 工具 可 能 需要 便利 地 表示 项 和 项 集 。 请 注意 ,一 个 
项 可 以 表示 为 一 对 整数 ,第 一 个 整数 是 基础 文法 的 产生 式 编号 ,第 二 个 整数 是 点 的 位 置 。 项 集 
可 以 用 这 些 数 对 的 列表 来 表示 。 然 而 ,如 我 们 将 看 到 的 ,需要 用 到 的 项 集 通 常 包 含 " 闭 包 " 项 ， 
这 些 项 的 点 位 于 产生 式 体 的 开始 处 。 这 些 项 总 是 可 以 根据 项 集中 的 其 他 项 重新 构造 出 来 , 因 
此 我 们 不 必 将 它们 包含 在 这 个 列表 中 。 











直观 地 讲 , 项 指明 了 在 语法 分 析 过 程 中 的 给 定点 上 , 我 们 已 经 看 到 了 一 个 产生 式 的 哪些 部 
分 。 比 如 , WAS - XYZ 表明 我 们 希望 接 下 来 在 输入 中 看 到 一 个 从 XYZ 推导 得 到 的 串 。 项 
A 一 了 .YZ 说 明 我 们 刚刚 在 输入 中 看 到 了 一 个 可 以 由 头 推 必得 到 的 串 , 并 且 我 们 希望 接 下 来 看 到 
一 个 能 从 YZ 推导 得 到 的 串 。 项 4 一 YYZ 表示 我 们 已 经 看 到 了 产生 式 体 XYZ, 已 经 是 时 候 把 
XYZ 归 约 为 4 了。 

一 个 称 为 规范 LR(0) 项 集 族 ( canonical LR(0) collection) 的 一 组 项 集 提供 了 构建 一 个 确定 有 穷 
自动 机 的 基础 。 该 自动 机 可 用 于 做 出 语法 分 析 决定 。 这 样 的 有 穷 自 动机 称 为 LR(0) 自动 机 8。 更 明 
确 地 说 , 这 个 LR(0) 自动 机 的 每 个 状态 代表 了 规范 LR(0) 项 集 族 中 的 一 个 项 集 。 表 达 式 文法 (4.1) 
的 对 应 的 自动 机 显示 在 图 4-31 中 。 我 们 将 把 它 用 做 讨论 规范 LR(0) 项 集 族 的 连续 使 用 的 例子 。 

为 了 构造 一 个 文法 的 规范 LR(0) 项 集 族 , 我 们 定义 了 一 个 增 广 文法 (augmented grammar) 和 





“号 从 技术 上 讲 ,根据 3.6.4 节 的 定义 ,这 个 自动 机 并 不 是 确定 自动 机 ,因为 我 们 没有 对 应 于 空 项 集 的 死 状态 。 结 果 是 
“有 一 些 状态 - 输入 对 没有 后 继 状 态 。 
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两 个 函数 : CLOSURE 和 GOTO, WAS C 是 一 个 以 5 为 开始 符号 的 文法 , 那么 6 的 增 广 文法 C 就 
是 在 6 中 加 上 新 开始 符号 8$ 和 产生 式 S =S 而 得 到 的 文法 。 引 人 这 个 新 的 开始 产生 式 的 目的 是 
告诉 语法 分 析 器 何 时 应 该 停止 语法 分 析 并 宣称 接受 输入 符号 串 。 也 就 是 说 , 当 且 仅 当 语法 分 析 器 
要 使 用 规则 S'S 进行 归 约 时 ,输入 符号 串 被 接受 。 

































































( 
ESE.4+TR7 | FOE): 
FA(E- )| 
Ea 




















和 Ty — E 
CEE 


4-31 ”表达 式 文法 (4.1) 的 LR(0) 自 动机 





项 集 的 闭 包 
如 果 7 是 文法 C 的 一 个 项 集 , 那么 CLOSURE (1) 就 是 根据 下 面 的 两 个 规则 从 7 构造 得 到 的 
HE: 
1) 一 开始 , 将 1 中 的 各 个 项 加 入 到 CLOSURE (J) 中 。 
2) 如 果 Ao + BB 在 CLOSURE(7) 中 , Boy 是 一 个 产生 式 , 并且 项 BO + y 不 在 CLOSURE (1) 
中 , 就 将 这 个 项 加 入 其 中 。 不 断 应 用 这 个 规则 , 直到 没有 新 项 可 以 加 入 到 CLOSURE( 7) 中 为 止 。 
直观 地 讲 ，CLOSURE(7) 中 的 项 Asa + BB 表明 在 语法 分 析 过 程 的 某 点 上 , 我 们 认为 接 下 来 
可 能 会 在 输入 中 看 到 一 个 能 够 从 BB 推导 得 到 的 子 串 。 这 个 可 从 BB 推导 得 到 的 子 串 的 某 个 前 绥 
可 以 从 B 推导 得 到 , 而 推导 时 必然 要 应 用 某 个 B 产生 式 。 因 此 我 们 加 入 了 各 个 B 产生 式 对 应 的 
项 , 也 就 是 说 , 如 果 Boy 是 一 个 产生 式 , 那么 我 们 把 8 一 .y 加 入 到 CLOSURE(/) Fo 
Gi) 4. 40 考虑 增 广 的 表达 式 文法 : 
E' +E 
E+E +TIT 
ToT * FIF 


F—(E) | id 
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如 果 了 是 由 一 个 项 组 成 的 项 集 |[ 尼 一 E]}, 那么 CLOSURE(1) BA T A 431 中 的 项 集 万 。 
下 面 说 明 一 下 如 何 计算 这 个 闭 包 。 根 据 规 则 (1), 忆 一 :已 被 放 到 CLOSURE(7) 中。 因为 点 
的 右边 有 一 个 五 , 我 们 加 入 如 下 的 产生 式 , 点 位 于 产生 式 体 的 左 端 : E> ETRE -To Be 
在 ,后 一 个 项 中 有 一 个 了 在 点 的 右边 , 因此 我 们 加 入 了 >， + Te PATO Fo EER, 位 于 点 右边 
WF SRA Fo + (LE) AIFS id, 然后 就 不 再 需要 加 入 任何 新 的 项 。 口 
闭 包 可 以 按照 图 4-32 中 的 方法 计算 。 实 
现 函 数 closure 的 一 个 便利 方法 是 设置 一 个 布 
尔 数 组 added, 该 数组 的 下 标 是 G 的 非 终 结 符 
号 。 当 我 们 为 各 个 8 产生 式 Boy 加 入 对 应 





SetOfftems CLOSURE(/) { 
bool: 
repeat 
for ( J 中 的 每 个 项 4 > a BB ) 
for (G NYE By) 
if GB 人 不 在 J 中 ) 





的 项 Bo + y WY, added[ B1 被 设置 为 true。 
请 注意 , 如 果 点 在 最 左 端的 某 个 8 产生 
式 被 加 人 到 了 的 闭 包 中 , 那么 所 有 B 产生 式 
都 会 被 加 和 人 到 这 个 闭 包 中 。 因 此 在 某 些 情况 
下 ,不 需要 真 的 将 那些 被 CLOSURE 函数 加 入 





B+ yma JP; 
until 在 某 一 轮 中 没有 新 的 项 被 加 和 人 到 ,中 | 
return J; 


Æ 4-32 CLOSURE 的 计算 





到 7 中 的 项 8- .yy 列 出 来 ,只 需要 列 出 这 些 被 加 入 的 产生 式 的 左 部 非 终结 符号 就 足够 了 。 我 们 
将 感 兴趣 的 各 个 项 分 为 如 下 两 类 : 

1) ABR: 包括 初始 项 S'，, $ 以 及 点 不 在 最 左 端的 所 有 项 。 

2) 非 内 核 项 : RT S>- 5 之 外 的 点 在 最 左 端的 所 有 项 。 

不 仅 如 此 , 我们 感 兴趣 的 每 一 个 项 集 都 是 某 个 内 核 项 集合 的 闭 包 ， 当然， 在 求 闭 包 时 加 入 的 
项 不 可 能 是 内 核 项 。 因 此 , 如果 我 们 抛弃 所 有 非 内 核 项 , 就 可 以 用 很 少 的 内 存 来 表示 真正 感 兴 
的 项 的 集合 ,因为 我 们 已 知 这 些 非 内 核 项 可 以 通过 闭 包 运算 重新 生成 。 在 图 4-31 中 , 非 内 核 项 位 
于 表示 状态 的 方 框 的 阴影 部 分 中 。 

GOTO me 

第 二 个 有 用 的 函数 是 GOTO], X), Arp I BRT X BP IAS. COTO, X) 
定义 为 7 中 所 有 形 如 [Aa + Xp] 的 项 所 对 应 的 项 [4>aX - B] 的 集合 的 闭 包 。 直 观 地 讲 ，GOTO 
函数 用 于 定义 一 个 文法 的 LR(0) 自动 机 中 的 转换 。 这 个 自动 机 的 状态 对 应 于 项 集 , 而 OTOC, 
X) 描述 了 当 输 入 为 对 时 离开 状态 了 的 转换 。 
EE 和 如果 /是 两 个 项 的 集合 [[E' 一 E. ], [E>E: +7]|, 那么 GOTO(1，+) 包 含 如 
下 项 










E>E++T 
T+ +TxF 
T=. F 
F—+ + (E) 
Fo - id 
我 们 查找 7 中 点 的 右边 紧 跟 + 的 项 , 就 可 以 计算 得 到 GOTO(1，+ ) 。E' 一 E. 不 是 这 样 的 项 ， 


JE ESE . +7 是 这 样 的 项 。 我们 将 点 移 过 + 号 得 到 EE + +7, 然后 求 出 这 个 单元 素 集 合 的 
闭 包 。 口 


所 示 。 
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PELA 文法 (4.1) 的 规范 LR(0) 项 集 族 和 GOTO 函数 如 图 4-31 所 示 。 其 中 ,GOTO 函数 用 图 
中 的 转换 表示 。 void items(G’) { 

LR(0) 自动 机 的 用 法 C ={cLosure({[S' = -S]})}; 

epeat 

“简单 LR 语法 分 析 技 术 ”( 即 SLR 分 for (C 中 的 每 个 项 焦 7) 
析 技 术 ) 的 中 心思 想 是 根据 文法 构造 出 eU 
LR(0) 自动 机 。 这 个 自动 机 的 状态 是 规 “He GOTO, X) IMA CP; 
范 LR( 0 ) 项 集 族 中 的 元 素 , 而 它 的 转换 i until 在 其 一 轮 中 没有 新 的 项 集 被 加 入 到 C 中 ; 
由 GOTO 函数 给 出 。 表 达 式 文法 (4.1) 的 
LR(0) 自 动机 已 经 在 前 面 的 图 4-31 Fb 图 4-33 ”规范 LR(0) 项 集 族 的 计算 


这 个 LR(0) 自动 机 的 开始 状态 是 CLOSURE( | [S> + S]}), 其 中 5' 是 增 广 文法 的 开始 符号 。 
所 有 的 状态 都 是 接受 状态 。 我 们 说 的 “状态 j” 指 的 是 对 应 于 项 集 L 的 状态 。 

LR(0) 自动 机 是 如 何 帮助 做 出 移 人 - 归 约 决定 的 呢 ? 移 入 - 规约 决定 可 以 按照 如 下 方式 做 
出 。 假 设 文法 符号 串 y 使 LR(0) 自动 机 从 开始 状态 0 运行 到 某 个 状态 六 那么 如 果 下 一 个 输入 符 
号 为 a 且 状 态 / 有 一 个 在 上 的 转换 , MBA a。 否则 我 们 就 选择 归 约 动作 。 状 态 j 的 项 将 告诉 我 
们 使 用 哪个 产生 式 进行 归 约 。 

将 在 4.6.3 节 中 介绍 的 LR 语法 分 析 算 法 用 它 的 栈 来 跟踪 状态 及 文法 符号 。 实 际 上 , 文法 符 
号 可 以 从 相应 状态 中 获取 , 因此 它 的 栈 只 保存 状态 。 下 面 的 例子 将 展示 如 何 使 用 一 个 LR(0) 自 
动机 和 一 个 状态 栈 来 做 出 移入 - 归 约 语法 分 析 决 定 。 

GEE 图 4-34 给 出 了 一 个 使 用 图 4-31 中 的 LR(0) 自动 机 的 移入 - 归 约 语法 分 析 器 在 分 析 


























id = id 时 采取 的 动作 。 我 们 使 用 一 Be tE Te 输入 动作 

个 栈 来 保存 状态 。 为 清晰 起 见 , 栈 中 qa) lo $ id id $ | BABS 

状态 所 对 ae eB St “g (2) | 05 $id «id $ | 按照 F > id 归 约 

na 所 应 的 文法 和 有 显示 在 符 (3) | 03 $F xid$ | 按照 全 > FJ 

号 " 列 中 。 在 第 1 行 , 栈 中 存放 了 自 (4) | 02 ST +id S | 移入 到 了 

动机 的 开始 状 太 0 HAT Fee BE (5) |027 | $Tx id $ | BABI 5 

底 标 记 $ 。 (7) |02710 |$T«F $ | 按照 区 >T FRH 
EREE ; : (8) | 02 $T $ | ET 归 约 

F 个 输入 符号 是 id, 而 状态 0 (9 01 $E $ | 接受 























在 这 上 有 一 个 到 达 状 态 5 的 转换 。 

因此 我 们 选择 移 人 。 在 第 2 行 , 状态 图 4-34 id * id 的 语法 分 析 

SCARS id) 已 经 被 压 人 到 栈 中 。 从 状态 5 出 发 没有 输入 * 上 的 转换 ,因此 我 们 选择 归 约 。 根 据 状 
态 5 中 的 项 [Fid ， ], 这 次 归 约 应 用 产生 式 Fid, 

如 果 栈 中 保存 的 是 文法 符号 , 那么 归 约 就 是 通过 将 相应 产生 式 的 体 (在 第 2 行 中 ,产生 式 的 
体 是 id) 弹出 栈 并 将 产生 式 头 (在 这 个 例子 中 是 忆 压 人 栈 中 来 实现 的 。 现 在 栈 中 保存 的 是 状态 ， 
我 们 弹出 和 符号 id 对 应 的 状态 5, 使 得 状态 0 成 为 栈 顶 。 然 后 我 们 寻找 一 个 天 ( 即 该 产生 式 的 头 
部 ) 上 的 转换 。 在 图 4-31 中 , 状态 0 有 一 个 下 上 的 到 达 状 态 3 的 转换 , 因此 我 们 压 人 状态 3。 这 
个 状态 对 应 的 符号 是 F, 见 第 3 行 。 
我们 看 另 一 个 例子 , 考虑 第 5 行 , 状态 7( 符 号 * ) 位 于 栈 顶 。 这 个 状态 有 一 个 刘 上 的 到 达 状 
态 5 的 转换 ， 因 此 我 们 将 状态 5( 符 号 id) EARP. RES 没有 转换 , 因此 我 们 按照 Fid 进行 
归 约 。 当 我 们 弹出 对 应 于 产生 式 体 id 的 状态 5 后 , 状态 7 到 达 栈 顶 。 因 为 状态 7 有 一 个 下 上 的 
转换 到 达 状 态 10, 我 们 压 入 状态 10( 符 号 F) 。 口 








4.6.3 LR 语法 分 析 算 法 

图 4-35 中 显示 了 一 个 LR 语法 分 析 器 的 示意 图 。 它 由 一 个 输入 、 一 个 输出 、 一 个 栈 、 一 个 驱 
动 程序 和 一 个 语法 分 析 表 组 成 。 这 个 分 析 表 包括 给 和 [of Jal Jais] 
两 个 部 分 (ACTION 和 GOTO), HA LR 语法 分 析 \ 
器 的 驱动 程序 都 是 相同 的 ,而 语法 分 析 表 是 随 语法 ee 
分 析 器 的 不 同 而 变化 的 。 语 法 分 析 器 从 输入 缓冲 E ee 
区 逐个 读 和 人 符号 。 当 一 个 移 和 人 - 归 约 语法 分 析 器 
移 人 一 个 符号 时 ，LR 语法 分 析 器 移 人 的 是 一 个 对 [5 机 
应 的 状态 。 每 个 状态 都 是 对 栈 中 该 状态 之 下 的 内 ACTION 
容 所 含 信息 的 摘要 。 E 

分 析 器 的 栈 存放 了 一 个 状态 序列 ws; oes, 其 图 4-35 一 个 LR 语法 分 析 器 的 模型 
中 sw 位 于 栈 顶 。 在 SLR 方法 中 , 栈 中 保存 的 是 LR(0) 自动 机 中 的 状态 , 规范 LR A LALR 方法 和 
SLR 方法 类 似 。 根 据 构造 方法 ,每 个 状态 都 有 一 个 对 应 的 文法 符号 。 回 顾 一 下 , 各 个 状态 都 和 某 
个 项 集 对 应 , 并 且 有 一 个 从 状态 i 到 状态 /的 转换 当 且 仅 当 COTO, X) =; MABARA J É 
转换 一 定 对 应 于 向 一 个 文法 符号 X。 因 此 , 除了 开始 状态 0 之 外 ,每 个 状态 都 和 唯一 的 文法 符号 
相关 联 9。 

LR 语法 分 析 表 的 结构 

语法 分 析 表 由 两 个 部 分 组 成 ; 一 个 语法 分 析 动作 函数 ACTION 和 一 个 转换 函数 COTO, 

1) ACTION 函数 有 两 个 参数 :一 个 是 状态 i, 另 一 个 是 终结 符号 a( 或 者 是 输入 结束 标记 $ )。 
ACTION[i, a] 的 取 值 可 以 有 下 列 四 种 形式 : 

@ 移 人 ) 其 中 j 是 一 个 状态 。 语 法 分 析 器 采取 的 动作 是 把 输入 符号 a 高 效 地 移 人 栈 中 , 但 
是 使 用 状态 /来 代表 a。 

@ 归 约 4 一 B。 语 法 分 析 器 的 动作 是 把 栈 顶 的 有 高效 地 归 约 为 产生 式 头 4。 

@ 接受 。 语 法 分 析 器 接受 输入 并 完成 语法 分 析 过 程 。 

@ 报错 。 语 法 分 析 器 在 它 的 输入 中 发 现 了 一 个 错误 并 执行 某 个 纠正 动作 。 我 们 将 在 4.8.3 
节 和 4. 9.4 节 中 进一步 讨论 这 样 的 错误 恢复 例 程 是 如 何 工 作 的 。 

2) 我 们 把 定义 在 项 集 上 的 COTO 函数 扩展 为 定义 在 状态 集 上 的 函数 : 如 果 COTO, A] =}, 
那么 COTO 也 把 状态 i 和 一 个 非 终结 符 号 4 映射 到 状态 j。 

LR 语法 分 析 器 的 格局 

描述 LR 语法 分 析 器 的 行为 时 , 我 们 需要 一 个 能 够 表示 LR 语法 分 析 器 的 完整 状态 的 方法 。 
语法 分 析 器 的 完整 状态 包括 : 它 的 栈 和 余下 的 输入 。LR 语法 分 析 器 的 格局 (configuration) 是 一 个 
jean: 

































(S051°°'Sins QiGi+1 an $) 3 

的 对 。 其 中 ,第 一 个 分 量 是 栈 中 的 内 容 ( 右 侧 是 栈 顶 ) , 第 二 个 分 量 是 余下 的 输入 。 这 个 格局 表示 a 
了 如 下 的 最 右 句 型， 

X Xa X mait; yva 


它 表示 最 右 名 型 的 方法 本 质 上 和 一 个 移入 - RED TMA EA. HE KR Ta AE. 


n 








O 其 逆 命 题 不 一 定 成 立 。 也 就 是 说 ,多 个 状态 可 能 对 应 于 同一 个 文法 符号 。 例 如 ,图 4-31 中 的 LR(0) 自动 机 的 状态 ， 
1 和 8, 进 入 它们 的 都 是 上 的 转换 ;而 对 于 状态 2 和 9, 它 们 都 是 通过 7 了 上 的 转换 进入 。 


语法 分 新 159 





在 于 栈 中 存放 的 是 状态 而 不 是 文法 符号 ,从 这 些 状态 能 够 复原 出 相应 的 文法 符号 。 也 就 是 说 ,总 
是 状态 s; 所 代表 的 文法 符号 。 请 注意 ,so( 即 分 析 器 的 开始 状态 ) 不 代表 任何 文法 符号 , 它 只 是 作 
为 栈 底 标记 ,同时 也 在 语法 分 析 过 程 中 担负 了 重要 的 角色 。 

LR 语法 分 析 器 的 行为 l 

语法 分 析 器 根据 上 面 的 格局 决定 下 一 个 动作 时 ,首先 恋人 当前 输入 符号 a; AURORA sn 
然后 在 分 析 动作 表 中 查询 条 目 ACTON sn, a;]。 对 于 前 面 提 到 的 四 种 动作 ,每 个 动作 结束 之 后 
的 格局 如 下 : 

1) MR ACTION(s,,, a;i] =A s, 那么 语法 分 析 器 执行 一 次 移 人 动作 ; 它 将 下 一 个 状态 * 移 
入 栈 中 , 进入 格局 

(S95, ° SmS Aiala) 

符号 ai 不 需要 存放 在 栈 中 , 因为 在 需要 时 (在 实践 中 从 不 需要 a) 可 以 根据 * 恢复 出 a;。 现 
E, 当前 的 输入 符号 是 aj ,1。 

2) WR ACTION[s,,, a;] = 规约 4 一 B, 那么 语法 分 析 器 执行 一 次 归 约 动作 , 进入 格局 
S, @;0;,,777a, $) 


(sos) =s , 


其 中 ,是 B 的 长 度 , Hs =COTO[s,-,, 4]。 在 这 里 ,语法 分 析 器 首先 将 个 状态 符号 弹出 栈 , 使 
状态 sm-, 位 于 栈 顶 。 然 后 ,语法 分 析 器 将 s( 即 条 目 GOTO, snr, 4] 的 值 ) 压 和 人 栈 中 。 在 一 个 归 约 
动作 中 ， 当 前 的 输入 符号 不 会 改变 。 对 于 我 们 将 构造 的 LR 语法 分 析 器 ,对 应 于 被 弹出 栈 的 状态 
的 文法 符号 序列 Xp, nar Xn 总 是 等 于 B， 即 归 约 使 用 的 产生 式 的 右 部 。 

在 一 次 归 约 动作 之 后 , LR 语法 分 析 器 将 执行 和 归 约 所 用 产生 式 关联 的 语义 动作 , 生成 相应 
的 输出 。 我 们 暂时 假设 输出 的 内 容 仅仅 包括 打印 出 归 约 产生 式 。 - 

3) 如 果 ACTION[s。，oi] = 接受 , 那么 语法 分 析 过 程 完成 。 

4) 如 果 ACTION[ sn, ai] = 报错 , 则 说 明 语法 分 析 器 发 现 了 一 个 语法 错误 ,并 调用 一 个 错误 
恢复 例 程 。 

LR 语法 分 析 算 法 总 结 如 下 。 所 有 的 LR 语法 分 析 器 都 按照 这 个 方式 执行 , 两 个 LR 语法 分 析 
器 之 间 的 唯一 区 别 是 它们 的 语法 分 析 表 的 ACTION 表 项 和 COTO 表 项 中 包含 的 信息 不 同 。 
CERE IR 语法 分 析 算 法 。 

输入 : 一 个 输入 串 w 和 一 个 LR 语法 分 析 表 ,这 个 表 描 述 了 文法 6 的 ACTION 函数 和 GOTO 
函数 。 

输出 : US w ZE LCG) e, 则 输出 zw 的 自 底 向 上 语法 分 析 过 程 中 的 归 约 步骤 ;否则 给 出 一 个 错 
误 指 示 。 

方法 :最 初 ,语法 分 析 器 栈 中 的 内 容 为 初始 状态 ;o, 输入 缓冲 区 中 的 内 容 为 w$ 。 然 后 ,语法 
分 析 器 执行 图 4-36 中 的 程序 。 o 
UE a147 显示 了 表达 式 文法 (4.1) 的 一 个 LR 语法 分 析 表 中 的 ACTION 和 GOTO 函数 。 


下 面 再 次 给 出 文法 (4.1), 并 对 它们 的 产生 式 进 行 编号 : 








(1) E>E +T (4) ToF 
(2) E>T (5) F-(E) 
(3) T>T* F (6) 天 一 id 


各 种 动作 在 此 图 中 的 编码 方法 如 下 : 
1) si 表示 移入 并 将 状态 i 压 栈 。 
2) 表示 按照 编号 为 7 的 产生 式 进行 归 约 。 
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第 4 章 








ean oy 的 第 一 个 符号 ; 
while(1) { /* 永远 重复 i 
令 s 是 栈 顶 的 状态 
if ( ACTION[s,a] = HAL ) { 
将 LA REE ; 


令 a 为 下 一 


-个 输入 符号 ; 


} else if ( AcTION[s, a] = 


BSAP) { 


从 栈 中 弹 出 | 有 个 符号 
Bin 为 当前 的 栈 顶 状 态 ; 
将 GOTO[t, A] EAR ; 
输出 产生 式 A 2: 

} else if ( ACTION(s,a] = 接受 ) 





break; /* 语法 分 析 完 成 #/ 


else 调用 错误 恢复 例 程 ; 











图 4-36 LR 语法 分 析 程 序 


3) ace 表示 接受 。 




















4) 空白 表示 报错 。 

请 注意 ,对 于 终结 符号 a, GOTO[s, a] Rate ma 
的 值 在 ACTION 表 项 中 给 出 ,这 个 值 和 在 输入 | PE Gaps le oF 
a MA. GO- 0 s5 s4 1 2 3 

TO 条 目 给 出 了 对 应 于 非 终结 符号 4 的 | 3 | a an 
GOTO[ s, 4] 的 值 。 我 们 还 没有 解释 图 4-37 3 r4 r4 r4 r4 
的 表 中 各 个 条 目 是 如 何 得 到 的 ,但 很 快 就 会 | 1 | gt wn | 
来 处 理 这 个 问题 。 6 |s5 ` s4 9 3 

在 处 理 输 入 id * id + iam, BAMA | 8 |” gy 
内 容 的 序列 显示 在 图 4-38 中 。 为 清晰 起 见 ， ee ome 
图 中 还 显示 了 与 栈 中 状态 对 应 的 文法 符号 的 | i pias. cea 


序列 。 比 如 , 在 第 1 行 中 ,LR 语法 分 析 器 位 











于 状态 0 上 。 这 是 初始 状态 ， 


没有 对 应 的 文法 


图 4-37 表达 式 文法 的 语法 分 析 表 


符号 , 而 第 一 个 输入 符号 是 id。 图 4-37 中 的 动作 部 分 第 0 行 、id 列 中 的 动作 是 $5, 表示 应 该 移 


A, 将 状态 5 压 栈 。 在 第 2 行 


， 状态 符号 5 被 压 人 到 栈 中 , 而 id 从 输入 中 被 删除 。 























ae) a eee = = 
| tk 符号 输入 | 动作 

(1) | 0 id vid +ias | BA 

(2) 105 id *id 十 id$ | 根据 下 一 id 归 约 
(3) | 03 F sid+idS ET = F 归 约 
(4) | 02 T xid+id$ | BA 

(5) | 027 Tx id+id$ | BA 

(6)|0275 | T«id +id$ | REF 一 id 1345 
(7) |02710| TF +id$ | RET > T + F129 
(8) |02 T +id$ | RRE >T 归 约 
(9) | 01 E +id$ | BA 

(10) | 016 E+ id$ | BA 

(11) 10165 | E+id $ | 根据 F > id 归 约 
(12) 10163 | B+F $ | 根据 T 一 F 归 约 
(13) | 0169 | B+T $ | 根据 E > 已 十 了 归 约 
(14) | 01 | E $ | 接受 





图 4-38 


一 个 LR 语法 分 析 器 处 理 输 入 id * id + id 的 各 个 步骤 
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然后 ，* 变 成 了 当前 的 输入 符号 ,而 状态 5 在 输入 为 * 时 的 动作 是 根据 产生 式 Pid 进行 归 
约 。 一 个 状态 符号 被 弹出 栈 。 然 后 ,状态 0 成 为 栈 项 。 因 为 状态 0 对 于 下 的 GOTO 值 是 3, 网 此 状 
态 3 被 压 到 栈 中 。 现 在 我 们 得 到 第 3 行 中 的 格局 。 下 面 的 各 个 动作 的 执行 方式 与 此 类 似 。 ja 
4.6.4 构造 SLR 语法 分 析 表 

构造 语法 分 析 表 的 SLR 构造 方法 是 研究 LR 请 法 分 析 技 术 的 很 好 的 起 点 。 我 们 把 使 用 这 种 
方法 构造 得 到 的 语法 分 析 表 称 为 SLR 语法 分 析 表 , 并 把 使 用 SLR 语法 分 析 表 的 LR 语法 分 析 器 称 
为 SLR 语法 分 析 器 。 男 外 两 种 SLR 方法 通过 向 前 看 信息 来 增强 分 析 能 力 。 

SLR 方法 以 4.5 节 介 绍 的 LRC0) 项 和 LR(O) 自动 机 为 基础 。 也 就 是 说 , 给 定 一 个 文法 G, 我 
们 通过 添加 新 的 开始 符号 5' 得 到 增 广 文法 6'。 我 们 根据 C' 构 造 出 6 的 规范 项 集 族 C 以 及 COTO 
函数 。 

然后 ,使 用 下 面 的 算法 就 可 以 构造 出 这 个 语法 分 析 表 中 的 ACTION 和 GOTO 条 目 。 它 要 求 我 
们 知道 输入 文法 的 每 个 非 终结 符号 4 的 FOLLOW(4)( 见 4.4 节 )。 
构造 一 个 SLR 语法 分 析 表 。 
输入 : 一 个 增 广 文法 C'e 
输出 : 6: 的 SLR 语法 分 析 表 函数 ACTION 和 GOTO, 
方法 : 
1) 构造 6' 的 规范 LR(0) 项 集 族 C= jin, +, |。 
2) 根据 1, 构造 得 到 状态 i。 状态 i 的 语法 分 析 动 作 按照 下 面 的 方法 决定 : 
| D Wl Aa + aBj 在 7; 中 并 且 COTO(/,, a) =1,, 那么 将 ACTION[i, a] 设 置 为 “ 移 人 j”。 

这 里 a 必须 是 一 个 终结 符号 。 

© mR Aa. ] 在 7; 中 ,那么 对 于 FOLLOW(4) 中 的 所 有 a, 将 ACTION[i, oj 设置 为 “ 归 
约 Aa”, 这 里 4 不 等 于 5S'。 

© 如 果 [5' 一 5 Æ H, AH ACTON i, $ 1] 设置 为 “接受 ”。 

如 果 根 据 上 面 的 规则 生成 了 任何 冲突 动作 , 我 们 就 说 这 个 文法 不 是 SLR(1) 的 。 在 这 种 情况 
下 ,这 个 算法 无 法 生成 一 个 语法 分 析 器 。 

3) 状态 i 对 于 各 个 非 终结 符号 4 的 GOTO 转换 使 用 下 面 的 规则 构造 得 到 : 如 果 GOTOCT,, A) 
=1;, 那么 GOTO[i, A] =j。 

4) 规则 (2) 和 (3) 没有 定义 的 所 有 条 目 都 设置 为 “报错 ”。 

5) 语法 分 析 器 的 初始 状态 就 是 根据 [5' 一 * S] 所 在 项 集 构造 得 到 的 状态 。 w 

由 算法 4. 46 得 到 的 由 ACTION 函数 和 GOTO 函数 组 成 的 语法 分 析 表 被 称 为 文法 6 的 SLR(1) > 
MA. WE C 的 SLR(1) 分 析 表 的 LR 语法 分 析 器 称 为 G 的 SLR (1) 语 法 分 析 器 。 一 个 具有 
SLR(1) 语 法 分 析 表 的 文法 被 称 为 是 SLR(1) 的 。 我 们 常常 省 略 “SLR” 后 面 的 “(1)”，, 因为 我 们 
不 会 在 这 里 处 理 向 前 看 多 个 符号 的 语法 分 析 器 。 . 
让 我 们 为 增 广 表达 式 文法 构造 SLR 分 析 表 。 这 个 文法 的 规范 LR(0) 项 集 族 如 图 4-31 
AR. BIS RM Ip: 











Bia E 
Eo>-E+T 





F>- (E) 
F— » id 
其 中 的 项 F . ( E ) 使 得 条 目 ACTION[0, (] = 移入 4, MF: id 使 得 条 目 ACTION[0， 

id] = 移入 5。1o 中 的 其 他 项 没有 生成 动作 。 现 在 考虑 N : 

EE: 

E>E: +T 
第 一 个 项 使 得 ACTION[1，$ ] = 接受, 第 二 个 项 使 得 ACTION[1，+ ] = 移 人 6。 下 一 步 
考虑 h: 

E>T - 

ToT: « F 
因为 FOLLOW(E) = | $ ，+，)1 ,第 一 个 项 使 得 

ACTION[2, $] = ACTION[2, +] = ACTION[2, )] = JAX ET 

第 二 个 项 使 得 ACTION[2，* ] = 移入 7。 按 照 这 个 方式 继续 推导 , 我们 就 得 到 了 图 4-37 所 示 的 
ACTION 和 GOTO 表 。 在 该 图 中 , 归 约 动作 中 的 产生 式 编号 和 它们 在 原文 法 (4. 1) 中 的 出 现 顺序 
相同 。 也 就 是 说 , ESE +7 的 编号 为 1,，E 一 7 的 编号 为 2, 依 此 类 推 。 口 
EIR 每 个 SLR(1) 文 法 都 是 无 二 义 人 性 的 , 但 是 存在 很 多 不 是 SLR(1 ) 的 无 二 义 性 文法 。 考 
虑 包含 下 列 产生 式 的 文法 : 





SoL=RIR 
L+* RIid (4. 49) 
l RL 
HfL ALR 分 别 看 作 代表 左 值 和 右 值 的 文法 符号 , 将 * 看 作 是 代表 “ 左 值 所 指向 的 内 容 ” 的 运 
算 符 9。 文法 4.49 对 应 的 规范 LR(0) 项 集 族 显示 在 图 4-39 中 。 








fp: 9 一 k: L>id 
S>- L=R 
S>-R I: S>L=-R 
了 一 下 R>-L 
R>- -L L> id 
L: S> sS Iz: L>+R- 
kL: S>L-=R Ig: R>L 
R> L- 
h: S>L=R 
Is: STOR. 
L: Lok 
R>-L 
L>- *R 
Lid 











图 4-39 文法 (4.49) 对 应 的 规范 LR(0) 项 集 族 





© 2.8.3 节 介绍 过 , 一 个 左 值 表 示 了 一 个 内 存 位 置 ,而 有 值 是 一 个 可 以 存放 在 某 个 位 置 上 的 值 。 
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考虑 项 集 1, 。 这 个 项 集中 的 第 一 个 项 使 得 ACTION[2，= ] 是 “ 移 人 6”。 因 为 FOLLOW(R) 
包含 = (考虑 推导 过 程 Sol = R= * R=R BITARRA), 第 二 个 项 将 ACTION[2，= ] 设 置 为 “ 归 
gy RL”。 央 为 在 ACTION[2，= ] 中 既 存 在 移入 条 目 又 存在 归 约 条 上 且 , 所 以 状态 2 在 输入 符号 
= 上 存在 移 人 / 归 约 冲突 。 

文法 (4. 49) 不 是 二 义 性 的 。 产 生 移 人 / 归 约 冲突 的 原因 是 构造 SLR 分 析 器 的 方法 功能 不 够 
强大 , 不 能 记 住 足够 多 的 上 下 文 信息 。 因 此 当 它 着 到 一 个 可 归 约 为 上 的 捉 时 , 不 能 确定 语法 分 析 
器 应 该 对 输入 = 采取 什么 动作 。 接 下 来 讨论 的 规范 LR 方法 和 LALR 方法 将 可 以 成 功 地 处 理 更 大 
的 文法 类 型 , 包括 文法 (4. 49 ) 。 然 而 请 注意 , 存在 一 些 无 二 义 性 的 文法 使 得 每 种 LR TB YEA TRE 
构造 方法 都 会 产生 带 有 语法 分 析 动 作 冲 突 的 语法 分 析 动 作 表 。 幸 运 的 是 , 在 处 理 程序 设计 语言 
时 ,一般 都 可 以 避免 使 用 这 样 的 文法 。 口 
4.6.5 可 行 前 组 

为 什么 可 以 使 用 LR(0) 自 动机 来 做 出 移入 - 归 约 决定 ?对 于 一 个 文法 的 移 人 - 归 约 语法 分 


是 某 个 最 右 句 型 的 前 级 。 如 果 栈 中 的 内 容 是 a 而 余下 的 输入 是 *, 那么 存在 一 个 将 ax 归 约 到 开 
始 符号 S 的 归 约 序列 。 用 推导 的 方式 表示 就 是 5S Sax, | 

然而 , 不 是 所 有 的 最 右 句 型 的 前 缀 都 可 以 出 现在 栈 中 ,因为 语法 分 析 器 在 移入 时 不 能 越过 句 
柄 。 比 如 , 假设 





ESF * id>(E) + id 

那么 在 语法 分 析 的 不 同时 刻 , REPAIR AAT LE (. CE ACE), EREE) * ,因为 
(五 ) 是 句柄 , 语法 分 析 器 必须 在 移 人 * 之 前 将 它 归 约 为 F。 

可 以 出 现在 一 个 移 人 - 归 约 语法 分 析 器 的 栈 中 的 最 右 句 型 前 缀 被 称 为 可 行 前 组 (viable pre- 
fix)。 它 们 的 定义 如 下 : 一 个 可 行 前 级 是 一 个 最 石 句 型 的 前 级, 并 且 它 没有 越过 该 最 右 句 型 的 
最 右 句柄 的 右 端 。 根 据 这 个 定义 , 我 们 总 是 可 以 在 一 个 可 行 前 弘之 后 增加 一 些 终 结 符号 来 得 
到 一 个 最 右 句 型 。 

SLR 分 析 技 术 基于 LR(0) 自动 机 能 够 识别 可 行 前 缀 这 一 事实 。 如 果 存 在 一 个 推导 过 程 5 之 
adu >a BB .w, 我 们 就 说 项 4 一 81. Bo MFA THA of, 有 效 。 一 般 来 说 , 一 个 项 可 以 对 多 个 可 
行 前 级 有 效 。 

项 AB, + B 对 op 有 效 的 事实 可 以 告诉 我 们 很 多 信息 。 当 我 们 在 语法 分 析 栈 中 发 现 op) 
时 , 这 些 信 息 可 以 帮助 我 们 决定 是 进行 归 约 还 是 移 人 。 特 别 是 ,如 果 B: xe, 那么 它 告诉 我 们 句柄 
还 没有 被 全 部 移 人 到 栈 中 , 因此 我 们 应 该 选择 移 人 。 如 果 p, =e, 那么 看 起 来 AB, 就 是 句柄 ， 
我 们 应 该 按照 这 个 产生 式 进 行 归 约 。 当 然 , 可 能 会 有 两 个 有 效 项 要 求 我 们 对 同一 个 可 行 前 绥 做 
不 同 的 事情 。 有 些 这 样 的 冲突 可 以 通过 查看 下 一 个 输入 符号 来 解决 , 还 有 一 些 冲突 可 以 通过 4.8 
节 中 的 方法 来 解决 , 但 是 我 们 不 应 该 认为 将 LR 方法 应 用 于 任意 文法 所 产生 的 语法 分 析 动 作 冲 突 
都 可 以 得 到 解决 。 

对 于 可 能 出 现在 LR 请 法 分 析 栈 中 的 各 个 可 行 前 综 , 我 们 可 以 很 容易 地 计算 出 对 应 于 这 些 可 
行 前 级 的 有 效 项 的 集合 。 实 际 上 ，LR 语法 分 析 理 论 的 核心 定理 是 : 如 果 我 们 在 某 个 文法 的 
LR(0) 自 动机 中 从 初始 状态 开始 沿 着 标号 为 某 个 可 行 前 级 y 的 路 径 到 达 一 个 状态 , 那么 该 状态 对 
应 的 项 集 就 是 y 的 有 效 项 集 。 实 质 上 ， 有 效 项 集 包 含 了 所 有 能 够 从 栈 中 收集 到 的 有 用 信息 。 我 
们 不 会 在 这 里 证 明 这 个 定理 , 但 我 们 将 给 出 一 个 例子 。 
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将 项 看 作 一 个 NFA 的 状态 
如 果 将 项 本 身 看 作 状 态 ,我 们 就 可 以 构造 出 一 个 识别 可 行 前 缀 的 不 确定 有 穷 自 动机 AN。 
CN 
为 < 的 转换 。 那 么 项 (AN 的 状态 ) 的 集合 7 的 CLOSURE ( 门 恰恰 就 是 3.7.1 节 中 定义 的 一 个 
NFA RERAN e HE H NFA N 通过 子 集 构造 法 可 以 得 到 一 个 DFA。 a. Xat T 
这 个 DFA 中 状态 了 在 符号 下 上 的 转换 。 从 这 个 角度 看 ,图 4-33 中 的 过 程 items( C) WEKT 
集 构 造 方法 应 用 于 以 项 作为 状态 的 NFA N 并 构造 出 DFA 的 过 程 。 

















Bi 证 我 们 再 次 考虑 增 广 表 达 式 文法 。 该 文法 的 项 集 和 GOTO 函数 如 图 4-31 所 示 。 显 然 ， 
RET 是 该 文法 的 一 个 可 行 前 组 。 图 4-31 中 的 自动 机 在 恋人 请 +T# 之 后 将 位 于 状态 7 Eo 
状态 7 中 包含 了 项 


ToT «x F 
RS 
F— «id : 
它们 恰恰 就 是 已 +T* 的 有 效 项 。 为 了 说 明 原 因 , 考虑 如 下 三 个 最 右 推导 : 
E' >E E'>E E's E 
>E +T >E + T >E +T 
>E +T» F >E +T F SE +T xF 
>E +T*(E) >E +T + id 


第 一 个 推导 说 明 TOT x . 下 是 有 效 的 , 第 二 个 推导 说 明 Foo (  ) 是 有 效 的 ， a. 
WHT Fo + id 是 有 效 的 。 可 以 证 明 E +T 没有 其 他 的 有 效 项 , 但 我 们 并 不 会 在 这 里 证 明 这 
事实 。 
4.6.6 4.6 节 的 练习 

练习 4. 6. 1: FIA RISEN A PT AT ATR ; 

1) 练习 4.2.2¢1) x% S081101, 

12) #3421 WX SSS + ISS las 

13) HY 4.2.2(3) MRSS (S) les 

练习 4. 6.2: 为 练习 4. 2. 1 中 的 ( 增 广 ) 文 法 构造 SLR 项 集 。 计 算 这 些 项 集 的 GOTO 函数 。 给 
出 这 个 文法 的 语法 分 析 表 。 这 个 文法 是 SLR 文法 吗 ? 

练习 4. 6.3: 利用 练习 4. 6. 2 得 到 的 语法 分 析 表 , 给 出 处 理 输入 aa * ac+ 时 的 各 个 动作 。 

练习 4. 6.4: 对 于 练习 4.2.2(1) ~ (7) 中 的 各 个 ( 增 广 ) 文 法 : 

1) 构造 SLR 项 集 和 它们 的 GOTO 函数 。 

2) 指出 你 的 项 集中 的 所 有 动作 冲突 。 

3) 如 果 存 在 SLR 语法 分 析 表 , 构造 出 这 个 语法 分 析 表 。 

练习 4. 6.5: 说 明 下 面 的 文法 





S-AaAb\BbBa 
Ae 
Boe 

是 LL(1) 的 , 但 不 是 SLR(1) 的 。 
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练习 4. 6.6: 说 明 下 面 的 文法 
S— SAIA 
A—a 
fe SLR(1) 的 , 但 不 是 LL(1) 的 。 
1! 练习 4. 6.7: 考虑 按照 下 面 方式 定义 的 文法 族 Gn: 
S—+A; b; Bpl<icn 
A,—a, A;\ aj Heep l<i,j<n Hi £j 
说 明 : 
1) G, A 2n? -n 个 产生 式 。 
2) G, 有 22 +n2 + 个 LR(0) 项 集 。 
3) G, 是 SLR(1) 的 。 
关于 LR 语法 分 析 器 的 大 小 , 这 个 分 析 结果 说 明了 什么 ? 
| 练习 4. 6. 8: 我 们 说 单个 项 可 以 看 作 一 个 不 确定 有 穷 自动 机 的 状态 , 而 有 效 项 的 集合 就 是 
一 个 确定 有 穷 自动 机 的 状态 ( 见 4.6.5 节 中 的 “将 项 看 作 一 个 NFA 的 状态 ”部 分 )。 对 于 练习 
4.2.1 的 文法 SSS+1|1SS*|a: 
1) 根据 “将 项 看 作 一 个 NPA 的 状态 ”部 分 中 的 规则 , 画 出 这 个 文法 的 有 效 项 的 转换 图 
(NFA) » 
2) 将 子 集 构造 算法 (算法 3.20) 应 用 于 在 (1) 部 分 构造 得 到 的 NFA。 得 到 的 DPA 和 这 个 文法 
的 LR(0) 项 集 相 比 有 什么 关系 ? 
1! 3) 说 明 在 任何 情况 下 , 将 子 集 构造 算法 应 用 于 一 个 文法 的 有 效 项 的 NFA 所 得 到 的 就 是 
该 文法 的 LR(0) 项 集 。 
1 练习 4. 6.9: 下 面 是 一 个 二 义 性 文法 : 
S—A Sib 
A— SAla 
构造 出 这 个 文法 的 规范 LR(0) 项 集 族 。 如 果 我 们 试图 为 这 个 文法 构造 出 一 个 LR 语法 分 析 
K, 必然 会 存在 某 些 冲 突 动 作 。 都 有 哪些 冲突 动作 ? 假设 我 们 使 用 这 个 语法 分 析 表 , 并 且 在 出 现 
冲突 时 不 确定 地 选择 一 个 可 能 的 动作 。 给 出 处 理 输入 abab 时 的 所 有 可 能 的 动作 序列 。 


4.7 更 强大 的 LR 语法 分 析 器 . 


在 本 节 中 , 我 们 将 扩展 前 面 的 LR 语法 分 析 技 术 , 在 输入 中 同 前 看 一 个 符号 。 有 两 种 不 同 的 
Tie: 

1) “PE LR” WHR, 或 直接 称 为 “LR” 方 法 。 它 充分 地 利用 了 向 前 看 符号 。 这 个 方法 使 用 
了 一 个 很 大 的 项 集 , 称 为 LR(1) 项 集 。 

2)“ 向 前 看 LR”, 或 称 为 “LALR” 方 法 。 它 基于 LR(0) 项 集 族 。 和 基于 LR(1) 项 的 典型 语法 
分 析 器 相 比 , 它 的 状态 要 少 很 多 。 通 过 向 LR(0) 项 中 小 心地 引入 向 前 看 符号 , 我 们 使 用 LALR 方 
法 处 理 的 文法 比 使 用 SLR 方法 时 处 理 的 文法 更 多 , 同时 构造 得 到 的 语法 分 析 表 却 不 比 SLR 分 析 
表 大 。 在 很 多 情况 下 ，LALR 方法 是 最 合适 的 选择 。 

在 介绍 了 这 两 种 方法 之 后 , 我 们 将 在 本 节 的 结尾 讨论 如 何在 一 个 内 存 有 限 的 环境 中 建立 简 
TAY LR 语法 分 析 表 。 
4.7.1 规范 LR(1) 项 

现在 我 们 将 给 出 最 通用 的 为 文法 构造 LR 语法 分 析 表 的 技术 。 回 顾 一 下 , 在 SLR 方法 中 ,如 
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果 项 集 1; BEH Aa: ], 且 当 前 输入 符号 a 在 FOLLOW(4) 中 , 那么 状态 i 就 要 按照 4 一 a 进 
行 归 约 。 然 而 在 某 些 情况 下 ， 当 状态 i 出 现在 栈 顶 时 , 栈 中 的 可 行 前 级 是 Ba 旦 在 任何 最 右 句 型 
中 a 都 不 可 能 跟 在 BA 之 后 ,那么 当 输 入 为 a 时 不 应 该 按照 Aca 进行 归 约 。 
例 4. 51 让 我 们 重新 考虑 例子 4. 48 ， 其 中 的 状态 2 包含 项 RL: 。 这 个 项 对 应 于 上 面 讨论 的 
Aa, MAN a 对 应 的 是 FOLLOW(R) 中 的 符号 =。 因此 ,SLR 语法 分 析 器 在 下 一 个 输入 为 = 且 状 
态 为 2 时 要 求 按照 RSL 进行 归 约 (因为 状态 2 中 还 包含 项 5 一 L， =R, 它 同时 还 要 求 执行 移 人 动 
VE), SRM, 例 4. 48 的 文法 没有 以 及 = … 开 头 的 最 右 句 型 。 因 此 状态 2 只 和 可 行 前 缀 地 对 应 ， 它 
实际 上 不 应 该 执行 从 工 到 RR 的 归 约 。 口 

如 果 在 状态 中 包含 更 多 的 信息 , 我 们 就 可 能 排除 掉 一 些 这 样 的 不 正确 的 4 一 a 归 约 。 在 必要 
时 , 我 们 可 以 通过 分 裂 某 些 状态 , 设法 让 LR 语法 分 析 器 的 每 个 状态 精确 地 指明 哪些 输入 符号 可 
以 跟 在 句柄 o 的 后 面 ,从 而 使 a 可 能 被 归 约 成 为 A。 

将 这 个 额外 的 信息 加 入 状态 中 的 方法 是 对 项 进行 精 化 , 使 它 包含 第 二 个 分 量 ,这 个 分 量 的 值 
为 一 个 终结 符号 。 项 的 一 般 形式 变 成 了 [4Aa* B, a], RP A> 是 一 个 产生 式 , 而 a 是 一 个 终 
结 符号 或 右 端 结束 标记 $ 。 我 们 称 这 样 的 对 象 为 LR(1) 项 。 其 中 的 1 指 的 是 第 二 个 分 量 的 长 度 。 
第 二 个 分 量 称 为 这 个 项 的 向 前 看 符号 中 。 在 形 如 [4-*a p, c] 且 BzFe 的 项 中 , 向 前 看 符号 没有 
任何 作用 , 但 是 一 个 形 如 [4 一 a， ,a] 的 项 只 有 在 下 一 个 输入 符号 等 于 a 时 才 要 求 按照 4 一 a 进 
行 归 约 。 因 此 , 只 有 当 栈 顶 状态 中 包含 一 个 LR(1) 项 [4 一 a , a), 我 们 才 会 在 输入 为 a 时 按照 
Aa 进行 归 约 。 这 样 的 a 的 集合 总 是 FOLLOW(4) 的 子 集 , 而 且 如 例 4.51 所 示 , 它 很 可 能 是 一 
个 真子 集 。 

正式 地 讲 , 我 们 说 LR(1) 项 [4 一 a + B, 4] 对 于 一 个 可 行 前 经 y 有 效 的 条 件 是 存在 一 个 推导 
S =5ôAw =dapw , 其 中 

l)y = ôa, H 

2) 要 么 a 是 w 的 第 一 个 符号 , BAwHe Ha SFS$. 
0) 4. 52 让 我 们 考虑 文法 











SB B 

B—aB |b 
该 文法 有 一 个 最 右 推导 5 aaBab 一 aaaBab。 在 上 面 的 定义 中 , 令 6=aa, A=B, w=ab, a =a E 
B=B, 我 们 可 知 项 [ Boo: B, oa] 对 于 可 行 前 缀 Y = aaa 是 有 效 的 。 另外 还 有 一 个 最 右 推 导 S > 
BaB 过 BaaB。 根 据 这 个 推导 , RAAM Boo: B，$ | HATH Baa 的 有 效 项 。 g 


4.7.2 构造 LR(1) 项 集 

构造 有 效 LR(1) 项 集 族 的 方法 实质 上 和 构造 规范 LR(0) 项 集 族 的 方法 相同 。 我 们 只 需要 修 
改 两 个 过 程 : CLOSURE 和 GOTO, 

为 了 理解 CLOSURE 操作 的 新 定义 , 特别 是 理解 为 什么 》 必 须 在 FIRST(pBa) 中 , 我 们 考虑 对 
某 些 可 行 前 级 y 有 效 的 项 集合 中 的 一 个 形 如 [4 一 a' BB,a] 的 项 ,那么 必然 存在 一 个 最 右 推导 
S =5Aax=—5aBBax , 其 中 y =5a。 假 设 Bax HES MABRY SAB by, 那么 对 于 某 个 形 如 Boy 的 产生 
式 , 我 们 有 推导 5 >yBby synby. Att, [Bo +n, b]Æ y 的 有 效 项 。 请 注意 , 可 能 是 从 B 推导 








O 当然 可 以 使 用 长 度 大 于 1 的 向 前 看 符号 种。 但 是 这 里 我 们 不 考虑 这 样 的 向 前 看 符号 串 。 
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得 到 的 第 一 个 终结 符号 , 也 可 能 在 Bax by 的 推导 过 程 中 6 推导 出 了 e, 因此 5 也 可 能 是 4a。 总 结 
这 两 种 情况 , 我 们 说 58 可 以 是 人 IRST(pBax) 中 的 任意 终结 符号 , 其 中 FIRST 是 在 4.4 节 中 定义 的 函 
数 。 请 注意 ,x 不 可 能 包含 by 的 第 一 个 终结 符号 ,因此 FIRST(Bax) = FIRST(pa)。 现 在 我 们 给 出 
LR(1) 项 集 的 构造 方法 。 

LR(1) 项 集 族 的 构造 方法 。 

输入 : 一 个 增 广 文法 6'。 

输出 : LR(1) 项 集 族 , 其 中 的 每 个 项 集 对 文法 6' 的 一 个 或 多 个 可 行 前 级 有 效 。 

方法 : 过 程 CLOSURE 和 GOTO, 以 及 用 于 构造 项 集 的 主 例 程 items 见 图 4-40。 口 








SetOfltems CLOSURE(J) { 
repeat 
for (了 中 的 每 个 项 [A > a-BB, a} ) 
for ( G 中 的 每 个 产生 式 如 一 7 ) 
for ( FIRST(Ba) 中 的 每 个 终结 符号 b ) 
[B > 37, 如 加 入 到 集合 1 中 ; 
umnt 计 不 能 向 了 中 加 入 更 多 的 项 ; 


return J; 
} f 
SetOfltems GOTO(/,X) { 
将 了 初始 化 为 空 焦 : 
for (了 中 的 每 个 项 [A > aX p,a) 
将 项 [4 一 qaX.8,@] 加 入 到 集合 了 中 ; 
return CLOSURE(J); 
} 


void items(G’) { 
将 C 初始 化 为 {CLOSURE] ({[5 > -S, §]}); 
repeat 
for ( C 中 的 每 个 项 集 了 ) 
for (每 个 文法 符号 X ) 
if (Goro(I, X) 非 空 且 不 在 C 中 ) 
将 coro(I, X) JMA C}; 

until 不 再 有 新 的 项 集 加 入 到 CC 中 ; 











图 4-40 为 文法 C'HE LR(1) 项 集 族 的 算法 


考虑 下 面 的 增 广 文法 : 
S'—5S 
S—CC (4.55) 
Coc Cld 
我 们 首先 计算 1[5' 一 ，S，$ ] | 的 闭 包 。 在 求 闭 包 时 , RIETS- 5，$ ] 和 过 程 CLO- 
SURE 中 的 项 [4-*a : BB, a] 相 匹配 。 也 就 是 说 ,4 =5', a=e, B=5, B= Mla= $o HR CLO- 
SURE 告诉 我 们 ,对 于 每 个 产生 式 By A FIRST (Ba) 中 的 终结 符号 上 将 项 [ B-* - y, 8] 加 入 到 闭 
包 中 。 对 于 当前 的 文法 ，B-*y 就 是 CC, 并 目 因为 8 是 e 且 a 是 $ ,5 只 能 是 $ 。 因 此 , RN 
增加 [ 5. CC，$ ]。 
我 们 继续 计算 闭 包 , 对 于 在 FIRST(C $ ) 中 的 5, 加 入 所 有 的 项 [ C - y, 5] 。 也 就 是 说 ,将 
[5S 一 .CC，$ ] 和 [4-a BB, a] 相 匹配 , 我 们 有 4=S, a=e, B=C,B=C 且 a=$。 因 为 C 不 
会 推导 出 空 串 , 所 以 FIRST(C $ ) = FIRST(C) 。 因 为 FIRST(C) 包 含 终结 符号 < Ad, 所 以 我 们 


168 第 4 童 





加 入 项 [C 一 eC, c], [C> < cC, d], (Co-d,c]MlC>-d, 4]。 在 这 些 项 中 , Bee eA 


的 都 不 是 非 终 结 符号 , 因此 我 们 已 经 完成 了 第 一 个 LR(I) 项 集 。 这 个 初始 项 集 是 : 
l: S'—: S, $ 
S>-CC, $ 
C+ cl, c/d 
C— : d, c/d 


为 表示 方便 , 我 们 省 略 了 方 括号 ,并 且 使 用 [ C> cC, cvd] 作 为 两 个 项 [ C 一 .cecC，c] 和 
[C 一 …cC, d] 的 缩写 。 
现在 我 们 对 不 同 的 半 值 计算 COTO(m , X) WX =S, 我 们 必须 求 [5' 一 S$ . ，$ ] 的 闭 包 。 
因为 点 在 最 右 端 ,所 以 无 法 加 入 新 的 项 。 因 此 我 们 得 到 下 一 -个 项 集 
l: S'—>S-, $ 
IF X=C, 我 们 求 [S 一 C . C，$ ] 闭 包 。 我 们 以 $ 作为 第 二 个 分 量 加 入 C 产生 式 , 之 后 不 能 再 
加 入 新 的 项 , 得 到 : 
I,; SoC+C, $ 
CH + cC, 
Co -d, $ 
接 下 来 SX =e. 我们 必须 求 1 [Ce C, c/d] WA. RIE c/d 作为 第 二 个 分 量 加 入 C 产 
ER, 得 到 ， 


中 
D 


L: C—c- C, c/d 
C— +cC, c/d 
C-> +d, c/d 
最 后 , OX ad, 我 们 得 到 项 集 : 
lı: C>œd + , c/d 
我 们 已 经 完成 了 Ty 上 的 GOTO 函数 。 我 们 没有 从 石 得 到 新 的 项 集 , 但 是 1, 有 相对 于 C、c 和 4 的 
GOTO 后 继 。 对 于 GOTO(/,, C), RITA 
Is: SoCC+, $ 
它 不 需要 进行 闭 包 运算 。 为 了 计算 GOTOO, c), RM [Coc C, $ RA, 得 到 
Ig: Coe: C, $ 
Co +c, $ 
C+ +d, $ 
请 注意 ,16 和 1 只 在 第 二 个 分 量 上 有 所 不 同 。 我 们 会 经 常 看 到 一 个 文法 的 多 个 LR(1) 项 集 
具有 相同 的 第 一 分 量 , 但 第 二 分 量 不 同 。 当 我 们 为 同一 个 文法 构造 规范 LR(0) 项 集 族 时 , 每 一 个 
LR(0) 项 集 将 和 一 个 或 多 个 LR(1) 项 集 的 第 一 分 量 集合 完全 一 致 。 我 们 将 在 讨论 LALR 语法 分 
析 技 术 的 时 候 更 加 深入 地 讨论 这 个 现象 。 
继续 计算 1 的 GOTO 函数 ，GOTO(P ,， d) MÆ 
l: C—>d:, $ 
现在 转 而 处 理 有, Jy 在 c Md EBI GOTO 值 分 别 是 3 和 有 。GOTO(1s,C) 是 
lg: C—C + , c/d 
1, Alls 没有 GOTO 值 , AA ET ASP BR aR ZE Be Hh, Je 在 c 和 d 上 的 GOTO 值 分 别 是 16 和 
I, 而 GOTO(I,g, C) Æ 
Ig: C—C., $ 
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其 余 的 各 个 项 集 都 没有 GOTO 值 ， 央 此 我 们 完成 了 所 有 项 焦 的 计算 。 网 4-41 显示 了 这 10 个 
项 集 和 它们 之 间 的 goto 关系 。 口 
[dy |g “hh 
sass | ace j 
S=>CCS | 
CcC, cfd | aca Pai 
crt J isscias F *Lsace.s 
Le CeC 
f C>.: 3 a J 2a a ae 
i | eae 08 | Teas | 
| | Cc, $ i ) Po 7 
E LC ie 
ya 
eee ee A E ho) 
é Cd.,$ J 
Cas Oh 人 | R 
Cae.C,efd ae ,e/a | 
1 CaeC,cfd £ 
| (Cadei e 
| = d Tr 
Ua ho] 
Cod-c/d | 
图 4-41 文法 (4.55) 的 GOTO 图 


4.7.3 规范 LR(1) 语 法 分 析 表 

现在 我 们 给 出 根据 LR(1) 项 集 构造 LR(1) 的 ACTION 和 GOTO 函数 的 规则 。 
些 函数 将 用 一 个 表 来 表示 ,只 是 表格 条 目 中 的 值 有 所 不 同 。 

C O 规范 LR 语法 分 析 表 的 构造 。 
一 个 增 广 文法 6'。 


和 前 面 一 样 , 这 





输入 : 
输出 : 6' 的 规范 LR 语法 分 析 表 的 函数 ACTION 和 GOTO, 
方法 : 


1) 构造 6' 的 LR(1) 项 集 族 C 


= |70， I, 


Pasig llo 


2) 语法 分 析 器 的 状态 i 根据 1; 构造 得 到 。 状 态 i 的 语法 分 析 动 作 按 


D 如 果 [4 一 ca aß, 5b] 在 1; 中 ,并且 COTOCT,, 
P 。 这 里 a 必须 是 一 个 终结 符号 

© 如 果 [ Aa ， ale I, hE ASS", 

© 如 果 [3 >S- , $ ] 在 7; 中, ALA ACTION[:, 





那么 将 ACTION[i, aJi 


照 下 面 的 规则 确定 : 
a) =L, 那么 将 ACTION[i,a] 设 置 为 “移入 





EA “MA Aa” o 
$ ] 设 置 为 “接受 ”。 


如 果 根 据 上 述 规则 会 产生 任何 冲突 动作 , 我 们 就 说 这 个 文法 不 是 LR(1) 的 。 在 这 种 情况 下 ， 


这 个 算法 无 法 为 该 文法 生成 一 个 语法 分 析 器 。 


3) 状态 i 相对 于 各 个 非 终 结 符号 4 的 goto 转换 按照 下 面 的 规则 构造 


= 4, 那么 GOTO[i A] = 六 


4) 所 有 没有 按照 规则 (2) 和 (3) 定 义 的 分 析 表 条 目 都 设 为 “报错 ”。 


得 到 : 如 果 GOTO(/,, A) 


5) 请 法 分 析 器 的 初始 状态 是 由 包含 [5S' 一 . S$，$ ] 的 项 集 构造 得 到 的 状态 。 加 


由 算法 4. 56 生成 的 语法 分 析 动 作 和 GOTO 函数 组 成 的 表 称 为 规范 LR(1) 语 
EDT OVERPASS SE MAA 


个 表 的 LR 语法 分 析 器 称 为 规范 LR(1) 语 法 分 析 器 。 如 果 语 法 


FIED. EAX 
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E, 那么 给 定 的 文法 就 称 为 LTR(1) 文 法 。 和 前 面 一 样 , 在 大 家 都 了 解 的 情况 下 我 们 将 省 略 “(1)”。 
UDEA 30 (4. 55) 的 规范 语法 分 析 表 如 图 4- 42 所 示 。 产 生 式 1、2 和 3 分 别 是 SCC, Co 




















cC 和 Cd. O | wees ACTION GOTO | 
每 个 SLR(1) 文 法 都 是 LR(1) 文 法 。 但 是 对 于 一 个 SLR(1) | S fo as [se 

文法 而 言 , 规范 LR(1) 语 法 分 析 器 的 状态 要 比 同一 文法 对 应 的 0 |s3 s4 1 2 

SLR 语法 分 析 器 的 状态 多 。 前 一 个 例子 中 的 文法 是 SLR 的 , 它 | 3 [oe sr | os 

的 SLR 语法 分 析 器 有 七 个 状态 ; 相 比 之 下 , 图 4- 42 中 有 十 个 i -i 8 

状态 。 5 rl 

4.7.4 构造 LALR 语法 分 析 表 TR ae R 
现在 我 们 介绍 最 后 一 种 语法 分 析 器 构造 方法 ， 即 LALR( 向 | 8 peon 








前 看 -LR) 技术 。 这 个 方法 经 常 在 实践 中 使 用 ， 因 为 用 这 种 方法 = 

得 到 的 分 析 表 比 规范 LR 分 析 表 小 很 多 , 而 下 大 部 分 常见 的 程序 442 文法 (4.55) 的 
设计 语言 构造 都 可 以 方便 地 使 用 一 个 LALR 文法 表示 。 对 于 ME LR 语法 分 析 表 

SLR 文法 , 这 一 点 也 基本 成 立 , 只 是 仍然 存在 少量 构造 不 能 够 方便 地 使 用 SLR 技术 来 处 理 ( 例如 ， 
见 例 4.48)。 

我 们 对 语法 分 析 器 的 大 小 做 一 下 比较 。 一 个 文法 的 SLR 和 LALR 分 析 表 总 是 具有 相同 数量 的 
状态 ,对 于 像 C 这 样 的 语言 来 说 , 通常 有 几 百 个 状态 。 对 于 同样 大 小 的 语言 , 规范 LR 分 析 表 通 党 
有 几 千 个 状态 。 因 此 , 构造 SLR 和 LALR 分 析 表 要 比 构造 规范 LR 分 析 表 更 容易 ， 而 且 更 经 济 。 

为 了 介绍 LALR 技术 ， 让 我 们 再 次 考虑 文法 (4. 55 ) 。 该 文法 的 LRO) 项 集 如 图 4- 41 所 示 。 
让 我 们 查看 两 个 看 起 来 差不多 的 状态 ,比如 1 和 1 。 它 们 都 只 有 一 个 项 , 其 第 一 个 分 量 都 是 (一 
d:o iP, 向 前 看 符号 是 “或 di; 在 中，$ 是 唯一 的 向 前 看 符号 。 

为 了 了 解 六 和 万 在 语法 分 析 器 中 担负 的 不 同 角色 , 请 注意 这 个 文法 生成 了 正则 语言 
ef dc" d。 当 读 入 输入 ce…cdcc…cd 的 时 候 , 请 法 分 析 器 首先 将 第 一 组 c 以 及 跟 在 它们 后 面 的 d 
移 人 栈 中 。 语 法 分 析 器 在 读 人 4 之 后 进入 状态 4。 然 后 ,当下 一 个 输入 符号 是 “或 4 时 ,语法 分 析 
器 按照 产生 式 Cod 进行 一 次 归 约 。 要 求 。 或 4 跟 在 后 面 是 有 道理 的 ,因为 它们 可 能 是 ce*d 中 的 
串 的 开始 符号 。 如 果 $ 跟 在 第 一 个 d 后面, 我 们 就 有 形 如 cod 的 输入 ,而 它们 不 在 这 个 语言 中 。 
如 果 $ 是 下 一 个 输入 符号 , 状态 4 就 会 正确 地 报告 一 个 错误 。 

语法 分 析 器 在 读 人 第 二 个 4 之 后 进入 状态 7。 然 后 ,语法 分 析 器 必须 在 输入 中 看 到 $ ,否则 
输入 开头 的 符号 串 就 不 具有 c* de'd 的 形式 。 因 此 状态 7 应 该 在 输入 为 $ 时 按照 Cd 进行 归 
约 ,而 在 输入 为 。 或 4 的 时 候 报告 错误 。 

现在 ,我 们 将 Ly 和 BOW Ley, DL 和 万 的 并 集 。 这 个 项 集 包含 了 [Cd , o/d/ 8 ] 所 代 
表 的 三 个 项 。 原 来 在 输入 d 上 从 Ty Ips Ty 到 达 14 或 的 goto 关系 现在 都 到 达 141。 状 态 47 在 所 
有 输入 上 的 动作 都 是 归 约 。 这 个 经 过 修改 的 语法 分 析 器 行为 在 本 质 上 和 原 分 析 器 一 样 。 虽 然 在 
有 些 情况 下 ， 原 分 析 器 会 报告 错误 ， 而 新 分 析 器 却 将 d 归 约 为 C。 比 如 , 在 处 理 ccd 或 cdede 这 样 
的 输入 时 就 会 出 现 这 样 的 情况 。 新 的 分 析 器 最 终 能 够 找到 这 个 错误 , 实际 上 这 个 错误 会 在 移入 
任何 新 的 输入 符号 之 前 就 被 发 现 。 

更 一 般 地 说 , 我 们 可 以 寻找 具有 相同 核心 (core) 的 LR(1) 项 集 , 并 将 这 些 项 集合 并 为 一 个 项 集 。 
所 谓 项 集 的 核心 就 是 其 第 一 分 量 的 集合 。 比 如 在 图 4- 41 h, u 和 万 就 是 这 样 一 对 项 集 , 它们 的 核 
DRI Cod + |。 类 似 地 , h 和 /6 是 另 一 对 这 样 的 项 集 , 它们 的 核心 是 | Ce C, Co + eC, 
C>: dj。 另外 ,还 有 一 对 项 集 h 和 Io, 它们 的 公共 核心 是 | CcC* |o WEE, MME, 一 个 核 
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心 就 是 当前 正 处 理 的 文法 的 LR(0) 项 集 , 一 个 LR(1) 文 法 可 能 产生 多 个 具有 相同 核心 的 项 集 。 

因为 GOTO(1,X) 的 核心 只 由 7 的 核心 决定 , 一 组 被 合并 的 项 集 的 GOTO 目标 也 可 以 被 合并 。 
因此 ， 当 我 们 合并 项 集 时 可 以 相应 地 修改 COTO 函数 。 动 作 函 数 也 需要 加 以 修改 ,以 反映 出 被 合 
并 的 所 有 项 集 的 非 报错 动作 。 

假设 我 们 有 一 个 LR(1) 文 法 , 也 就 是 说 ,这 个 文法 的 LR(1) 项 集 没 有 产生 语法 分 析 动作 冲 
突 。 如 果 我 们 将 所 有 具有 相同 核心 的 状态 蔡 换 为 它们 的 并 集 , 那么 得 到 的 并 集 有 可 能 产生 冲突 。 
但 是 因为 下 面 的 原因 ,这 种 情况 不 大 可 能 发 生 : 假设 在 并 集中 有 一 个 项 [4 一 a '，c] 要 求 按照 
4 -ae 进行 归 约 ， 同 时 另 一 个 项 [3 一 B + ay, 纪要 求 进行 移 人 ,那么 就 会 出 现在 向 前 看 符号 " 上 的 
冲突 。 此 时 必然 存在 某 个 被 合并 进来 的 项 集中 包含 项 [4-*a +, a], 同时 因为 所 有 这 些 状态 的 核 
心 都 是 相同 的 , 所 以 这 个 被 合并 进来 的 项 集中 必然 还 包含 项 [BB ay, c), 其 中 < 是 某 个 终结 
符号 。 如 果 这 样 的 话 , 这 个 状态 中 同样 也 有 在 输入 a 上 的 移入/ 归 约 冲突 ,因此 这 个 文法 不 是 我 
们 假设 的 LR(1) 文 法 。 因 此 , 合并 具有 相同 核心 的 状态 不 会 产生 出 原 有 状态 中 没有 出 现 的 移 人 / 
归 约 冲突 ,因为 移 人 动作 仅 由 核心 决定 , 不 考虑 向 前 看 符号 。 

然而 , 如 下 面 的 例子 所 示 , 合并 项 集 可 能 会 产生 归 约 / 归 约 冲 突 。 
Gl 4. 58 考虑 文法 





S'S 

SoaAdltbBdiaBelbAe 

4 一 c 

Boe 

该 文法 产生 四 个 串 acd, ace, bed 和 bce。 读 者 可 以 构造 出 这 个 文法 的 LR(1) 项 集 , 以 验证 该 

文法 是 LR(1) 的 。 完 成 这 些 工作 之 后 , 我 们 发 现 项 集 { [Ase , d], [Boc- ,ej | 是 可 行 前 缀 ac 
的 有 效 项 ，| [4 一 ce. , e], [Boc: ，d]} 是 be 的 有 效 项 。 这 两 个 项 集 都 没有 冲突 , 并 且 它 们 的 核 
心 是 相同 的 。 然 而 , 它们 的 并 集 ， 即 











Ac: , d/e 

B—c + , d/e 
产生 了 一 个 归 约 / 归 约 冲突 ， 因 为 当 输入 为 4 或。 的 时 候 , 这 个 合并 项 集 既 要 求 按照 4c 进行 归 
约 , 又 要 求 按照 Be 进行 归 约 。 m 


我 们 将 给 出 两 个 LALR 分 析 表 构造 算法 , 现在 来 介绍 其 中 的 第 一 个 。 这 个 算法 的 基本 思想 是 
构造 出 LR(1) 项 集 , 如 果 没 有 出 现 冲 突 , 就 将 具有 相同 核心 的 项 集合 并 。 然 后 我 们 根据 合并 后 得 
到 的 项 集 族 构 造 语法 分 析 表 。 我 们 将 要 描述 的 方法 的 主要 用 途 是 定义 LRLA(1) 文 法 。 构 造 整个 
LR(1) 项 集 族 需 要 的 空间 和 时 间 太 多 , 因此 很 少 在 实践 中 使 用 。 

ER aA, 但 空间 需求 大 的 LALR 分 析 表 的 构造 方法 。 

输入 : 一 个 增 广 文法 C'。 

输出 : 文法 G'KI LALR 语法 分 析 表 函数 ACTION 和 GOTO, 

方法 : 

1) 构造 LRC1) 项 集 族 C= ho, h, v, hlo 

2) 对 于 LR(1) 项 集中 的 每 个 核心 , 找 出 所 有 具有 这 个 核心 的 项 集 , 并 将 这 些 项 集 替换 为 它 
们 的 并 集 。 

3) SC’ ={Jo, Jy, +, | 是 得 到 的 LR(1) 项 集 族 。 状 态 i 的 语法 分 析 动 作 是 按照 和 算法 
4. 56 中 的 方法 根据 J; 构造 得 到 的 。 如 果 存 在 一 个 分 析 动 作 冲 突 , 这 个 算法 就 不 能 生成 语法 分 析 


ihe RAE 
器 , 这 个 文法 就 不 是 LALR(1) 的 。 

4) GOTO 表 的 构造 方法 如 下 。 如 果 J 是 一 个 或 多 个 LR(1) 项 集 的 并 集 , 也 就 是 说 = 了 11UD 
UU, 那么 GOTO(I,, X), GOTO(1,, X), =, GOTO(),, X) 的 核心 是 相同 的 , 因为 万 、 
Loe. LAAHR O. $ KÆ GOTO, X) 县 有 相同 核心 的 项 集 的 并 集 , 那 么 
GOTO(J, X) =K, 5 

算法 4.59 生成 的 分 析 表 称 为 G 的 LALR 语法 分 析 表 。 如 果 没 有 语法 分 析 动 作 冲 突 , 那么 给 
定 的 文法 就 称 为 LA4LR(1 ) 文 法 。 在 第 (3) 步 中 构造 得 到 的 项 集 族 被 称 为 L4LR(1) 项 集 族 。 
有 再 次 考虑 文法 (4. 55) 。 该 文法 的 COTO 图 已 经 显示 在 图 4- 41 中 。 我 们 前 面 提 到 过 ， 
有 三 对 可 以 合并 的 项 集 。/ 和 16 BURR NW EMM IEE : 
hg 5 C-=>c C, c/d/ $ 

C++ cC, c/d/ $ 

C+ d, c/d/ $ 











14 FA I KERI EMIIR: 
l: Cd + , c/d/ $ 
h Fl ly WERBN EMME l 

Igo: C—C + , c/d/ $ 
这 些 压 缩 过 的 项 集 的 LALR 动作 和 GOTO 函数 显示 在 图 4-43 中 。 
要 了 解 如 何 计算 GOTO KA, 考虑 GOTO(136, C)。 在 原来 的 LR(1) 项 集中 , GOTO, C) 











= Iq, TOBE 1 是 1 的 一 部 分 ,因此 我 们 令 GOTO(J6， OH [Kenos 
hos WERNE /6， 即 J 的 另 一 部 分 , 我 们 仍然 可 以 得 到 | E m oa 
相同 的 结论 。 也 就 是 说 ,，GOTO(16, C) =h, ME Igo 的 一 O | 886 s47 
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部 分 。 再 举 一 个 例子 。 考 虑 GOTO, c), MERA n Lii a aa e 
人 为 c 时 执行 移 人 之 后 的 状态 。 在 原来 的 LR(1) 项 集中 ,G0- 36 |s36 s47 

















TOC ,C) =16。 因为 1 现在 是 136 的 一 部 分 , PLL GOTO(R, | os 1 

OZRT heo KIE, 图 4-43 中 对 应 于 状态 2 和 输入 。 MAA pve eo 

被 设置 为 s36, 表示 移 人 并 将 状态 36 压 人 栈 中 。 D aka IF 4.54 BUSCH 
当 处 理 语言 ec* de * d 中 的 一 个 串 时 ， 图 4- 42 的 LR 语法 的 LALR SHAS 


分 析 器 和 图 4- 43 的 LALR 语法 分 析 器 执行 完全 相同 的 移入 和 
妇 约 动作 序列 , 尽管 栈 中 状态 的 名 字 有 所 不 同 。 比 如 , 在 LR 语法 分 析 器 将 1 或 1 压 人 栈 中 时 ， 
LALR 语法 分 析 器 将 136 压 入 栈 中 。 这 个 关系 对 于 所 有 的 LALR 文法 都 成 立 。 在 处 理 正确 的 输入 
时 ,LR 语法 分 析 器 和 LALR 语法 分 析 器 将 相互 模拟 。 1 
在 处 理 错误 的 输入 时 ，LALR 语法 分 析 器 可 能 在 LR 语法 分 析 器 报错 之 后 继续 执行 一 些 妇 约 
动作 。 然 而 ，LALR 语法 分 析 器 决 不 会 在 LR 语法 分 析 器 报错 之 后 移 人 任何 符号 。 比 如 , 在 输入 
为 ccd ARRIRA $HT, 图 4- 42 的 LR 语法 分 析 器 将 
0334 
压 人 栈 中 , 并 且 在 状态 4 上 发 现 一 个 错误 ,因为 下 一 个 输入 符号 是 $ 而 状态 4 在 $ 上 的 动作 为 报 
错 。 相 应 地 , 图 4- 43 中 的 LALR 语法 分 析 器 将 执行 对 应 的 操作 , 将 
0 36 36 47 
压 人 栈 中 。 但 是 状态 47 在 输入 为 $ 时 的 动作 为 归 约 C—d, HIE, LALR 语法 分 析 器 将 把 栈 中 内 
BBA 

















0 36 36 89 
现在 ,状态 89 在 输入 $ 上 的 动作 为 归 约 C->cC。 栈 中 内 容 变 为 
0 36 89 
此 时 仍 要 求 进 行 一 个 类 似 的 归 约 ,得 到 栈 
0 2 


最 后 , 状态 2 在 输入 $ 上 的 动作 为 报错 , 因此 现在 发 现 了 这 个 错误 。 
4.7.5 高 效 构造 LALR 语法 分 析 表 的 方法 
我 们 可 以 对 算法 4. 59 进行 多 处 修改 , 使 得 在 创建 LALR(1 ) 语 法 分 析 表 的 过 程 中 不 需要 构造 
出 完整 的 规范 LRO ) 项 集 族 。 
e 首先 , 我 们 可 以 只 使 用 内 核 项 来 表示 任意 的 LR(0) 或 LR(1) 项 集 。 也 就 是 说 ， 只 使 用 初始 
项 [3S 一 .3S] 或 1 一 :939，$] 以 及 那些 点 不 在 产生 式 体 左 端的 项 来 表示 项 集 。 
e 我 们 可 以 使 用 一 个 “传播 和 自发 生成 ”的 过 程 (我 们 稍 后 将 描 i 述 这 个 方法 ) 来 生 成 向 前 看 
符号 , 根据 LR(0) 项 的 内 核 生成 LALR(1) 项 的 内 核 。 
e 如 果 我 们 有 了 LALR(1) 内核, 我 们 可 以 使 用 图 4- 40 中 的 CLOSURE ph BOTA TAR A 
E, 然后 再 把 这 些 LALR(1) 项 集 当 作 规范 LR(1) 项 集 族 , 使 用 算法 4. 56 来 计算 分 析 表 条 
目 ， 从 而 得 到 LALR(1 ) 语 法 分 析 表 。 
我们 将 使 用 例子 4. 48 中 的 非 SLR 文法 作为 一 个 例子 , 说 明 高 效 的 LALR(1 ) 语 法 分 析 
表 构 造 方法 。 下 面 我 们 重新 给 出 这 个 文法 的 增 广 形式 : 


























S'S 
S—-L=R|R 
L—«R | id 
RL 
这 个 文法 的 完整 LTR(0) 项 集 显示 在 图 4-39 中 。 这 些 项 集 的 内 核 显 示 在 图 4- 44 中 。 口 
现在 我 们 必须 给 这 些 用 内 核 表示 的 lh: sas h: L>id 
LR(0) 项 加 上 正确 的 向 前 看 符号 ,创建 出 
LALR(1) 项 集 的 内 核 。 在 两 种 情况 下 , 向 | 了 一人 Be eRe A 
前 看 符号 5 可 以 添加 到 某 个 LALR(1) 项 集 | m SL =k hi Lak 
JAY LRO) Ñ Boy ,5 之 上 ; eae 
1) 存在 一 个 包含 内 核 项 [4 一 a .8B，| Is SAR Ip: R>L 
a] 的 项 集 1, 并 且 J=GOTO(T, X), 不 管 a | 7. Lx In: SLSR: 
为 何 值 , 在 按照 图 4- 40 的 算法 构造 
GOTO( CLOSURE( | [4 一 ac B, a]}, X) 4-44 文法 (4.49) 的 LR(0) 项 集 的 内 核 


时 得 到 的 结果 中 总 是 包含 [ By 8, 中。 对 于 Boy 6A, 这 个 向 前 看 符号 5 被 称 为 自发 生 
ae eee 特殊 情况 ， te 
其 余 条 件 和 (1) 相 同 , 但 是 a =), 且 按照 图 4-40 所 示 计 算 GOTO( CLOSURE( | [Aa - B, 

SUA ee ae ee A 
况 下 ， os rae ge 
传播 关系 并 不 取决 于 某 个 特定 的 向 前 看 符号 , 要 么 所 有 的 向 前 看 符号 都 从 一 个 项 传播 到 另 
项 , 要 么 都 不 传播 。 

我 们 需要 确定 每 个 LR(0) 项 集中 自发 生成 的 向 前 看 符号 , 同时 也 要 确定 向 前 看 符号 从 哪些 
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THERE FRAGT. NM SC LE AAS fa A, SH PE TCE PINES. GS Aca: B 
为 项 集 了 中 的 一 个 内 核 LR(0) 项 。 对 每 个 工 计 算 J = GOTO( CLOSURE({ [A> a: 8, #]}), X) 
对 于 J 中 的 每 个 内 核 项 , 我 们 检查 它 的 向 前 看 符号 集合 。 如 果 # 是 它 的 向 前 看 符号 , 那么 向 前 看 
符号 就 从 Ace -p 传播 到 了 这 个 项 。 所 有 其 他 的 向 前 看 符号 都 是 自发 生成 的 。 这 个 思想 在 下 面 
的 算法 中 被 精确 地 表达 了 出 来 。 这 个 算法 还 用 到 了 一 个 性 质 : ] 中 的 所 有 内 核 项 中 点 的 左边 都 是 
XX， 也 就 是 说 , 它们 必然 是 形 如 BoyX .5 的 项 。 
确定 向 前 看 符号 。 

输入 : 一 个 LR(0) 项 集 1 的 内 核 K 以 及 一 个 文法 符号 站 。 

输出 : 由 7 中 的 项 为 GOTO(I, 了) 中 内 核 项 自发 生成 的 向 前 看 符号 , 以 及 了 中 将 其 向 前 看 符号 
传播 到 GOTO, X) 中 内 核 项 的 项 。 

方法 : 算法 在 图 4- 45 中 给 出 。 




















for ( K 中 的 每 个 项 A 一 a8){ 

J := CLOSURE({[A = a-8,#)} ); 

if ( [B > y Xóa] EJ p, HBa KEF) 
断定 Gorol, X)} BAYH B — yA -8 RRES a 
是 自发 生成 的 ; 

if ( [B > 7-X6,#] 在 J ) 
断定 向 前 看 符号 从 了 中 的 项 4 一 Qa-8 传 播 到 了 GOTO(I, 羡 ) 中 的 项 
B=>yXó ZE; 











图 4-45 发现 传播 的 和 自发 生成 的 向 前 看 符号 


现在 我 们 可 以 把 向 前 看 符号 附加 到 LRO) 项 集 的 内 核 上 ， 从 而 得 到 LALR(I) 项 集 。 首 先 ， 
我 们 知道 $ 是 初始 LR(0) 项 集中 的 SS 的 向 前 看 符号 。 算 法 4. 62 给 出 了 所 有 自发 生成 的 向 
前 看 符号 。 将 所 有 这 些 向 前 看 符号 列 出 之 后 ,我 们 必须 让 它们 不 断 传播 , 直到 不 能 继续 传播 为 
止 。 有 很 多 方法 可 以 实现 这 个 传播 过 程 。 从 某 种 意义 上 说 , 所 有 这 些 方法 都 跟踪 已 经 传播 到 某 
个 项 但 是 尚未 传播 出 去 的 “新 ”向 前 看 符号 。 下 面 的 算法 描述 了 一 个 将 向 前 看 符号 传播 到 所 有 
项 中 的 技术 。 

LALR (1) 项 集 族 的 内 核 的 高 效 计算 方法 。 

输入 : 一 个 增 广 文法 C'。 

输出 : 文法 C' 的 LALR(1) 项 集 族 的 内 核 。 

方法 : 

1) 构造 6 的 LTR(0) 项 集 族 的 内 核 。 如 果 空 间 资源 不 紧张 ,最 简单 的 方法 是 像 4 6. 2 FABRE 
构造 LTR(0) 项 集 ,然后 再 删除 其 中 的 非 内 核 项 。 如 果 内 存 空 间 非常 紧张 , 我 们 可 以 只 保存 各 个 项 
集 的 内 核 项 ,并 在 计算 一 个 项 集 ! COTO 之 前 先 计算 /的 闭 包 。 

2) 将 算法 4. 62 应 用 于 每 个 LR(0) 项 集 的 内 核 和 每 个 文法 符号 X, 确定 COTO, X) 中 各 内 
核 项 的 哪些 向 前 看 符号 是 自发 生成 的 ,并 确定 向 前 看 符号 从 了 中 的 哪个 项 被 传播 到 COTO, X) 
中 的 内 核 项 上 。 

3) 初始 化 一 个 表格 , 表 中 给 出 了 每 个 项 集中 的 每 个 内 核 项 相关 的 向 前 看 符号 。 最 初 , 每 个 项 
的 向 前 看 符号 只 包括 那些 被 我 们 在 步骤 (2) 中 确定 为 自发 生成 的 符号 。 | 

4) 不 断 扫描 所 有 项 集 的 内 核 项 。 当 我 们 访问 一 个 项 ;时 , 使 用 步骤 (2) 中 得 到 的 、 用 表格 表 
示 的 信息 , 确定 i 将 它 的 向 前 看 符号 传播 到 了 哪些 内 核 项 中 。 项 i 的 当前 向 前 看 符号 集合 被 加 到 
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和 这 些 被 传播 的 内 核 项 相关 联 的 向 前 看 符号 集合 中 。 我 们 继续 在 内 核 项 上 进行 扫描 ,直到 没有 
”新 的 向 前 看 符号 被 传播 为 止 。 
eee) 我 们 为 例子 4. 61 的 文法 构造 LALR(1) 项 集 的 内 核 。 这 个 文法 的 LR(0) 项 集 的 内 核 如 
图 4-44 所 示 。 当 我 们 将 算法 4. 62 应 用 于 项 集 1o 的 内 核 时 , 我 们 首先 计算 CLOSURE( 1[ 3 一 
S, #| | ) , 即 




















S'+-S,# L>» *R,# = 
So>-+L = R,# Lo id, #/= 
5>:R,# R=: L, # 





在 这 个 闭 包 的 项 中 , 我 们 看 到 两 个 项 中 的 向 前 看 符号 = 是 自发 生成 的 。 第 一 个 项 是 /一 ，，* R。 
”这 个 项 中 点 的 右边 是 * , 它 生 成 了 [1 * R, =] WIEN, =Æ L Plo * ,及 的 自发 生成 的 
向 前 看 符号 。 类 似 地 , [L> id, = ] 告 诉 我 们 = 是 1s F Lid ， 的 自发 生成 的 向 前 看 符号 。 

因为 # 是 这 个 闭 包 中 六 个 项 的 向 前 看 符号 ,所 以 我 们 确定 1 PETES’ + $ 将 它 的 向 前 看 符 
号 传播 到 下 面 的 六 个 项 中 : 
| I, PH S'S - l, PAY L> +R 





L PH S>L- =R I, pH Lid - 
L 中 的 SOR - Ip REY ROL -> 


在 图 4-47 中 , 我 们 说 明了 算法 4. 63 的 步 又 (3) 和 (4) 。 标 号 为 INIT 的 列 给 出 了 各 个 内 核 项 
的 自发 生成 的 向 前 看 符号 。 这 些 符 号 中 只 包括 前 面 讨论 过 的 = 的 两 次 出 现 ， 以 及 初始 项 S$ S 
的 自发 生成 的 向 前 看 符号 $ 。 

在 第 一 趟 扫描 中 , 向 前 看 符号 $ 从 0 中 的 $ 一 :3 传播 到 图 4- 46 中 列 出 的 六 个 项 上 。 向 前 
看 符号 = 从 14 PHJ Lx o RARE) PH L> R 和 1s 中 的 R=-L. 上 。 它 还 传递 到 它 自身 
URI, 中 的 Lid: E, 但 是 这 些 向 前 看 符号 本 来 就 已 经 存在 了 。 在 第 二 和 第 三 趟 扫描 时 ,唯一 
被 传播 的 新 向 前 看 符号 是 $ ， 它 在 第 二 趟 扫描 时 被 传播 到 忆 和 4 的 后 继 中 , 并 在 第 三 趟 扫描 时 
到 达 16 的 后 继 中 。 在 第 四 趟 扫描 时 没有 新 的 向 前 看 符号 被 传播 , 因此 最 终 的 向 前 看 符号 集合 如 
图 4-47 最 右边 的 列 所 示 。 




































































项 集 项 向 前 看 符号 
初始 值 | 第 一 趟 | Be | 第 三 趟 
a 到 b: S' + -S $ $ $ $ 
b: SH.5 I: SoS 
h: S>L=R h: >S $ $ $ 
Ae ie B35 SR $ $ $ 
IG a ae $ $ $ 
le L&R RAL $ 
TA E ee | 
I: LowR L: LoaxR 
Is: Lid Iz Lid: = =/$ =/$ =/$ 
h: Lokk lk: S>L=-R $ $ 
k: SOL=-R| iy: Lo*R hk: Lok /$ 1$ 
I: E+ id me a = 
5 Ig: R-L- $ $ 
Pe Rae. oe a / / 
Ig: S>aL=R lo: S> L=R $ 
图 4-46 向 前 看 符号 的 传播 图 4-47 向 前 看 符号 的 计算 
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请 注意 ,在 例 4-48 中 , 使 用 SLR 方法 时 发 现 的 移 人 / 妇 约 冲突 在 使 用 LALR 技术 时 消失 了 。 
HR h PAI S-L- = 民生 成 了 在 输入 = 上 的 移 人 动作 , 但 是 六 PRL- 的 向 前 看 符号 只 包括 
$ ,因此 两 者 之 间 不 再 有 冲突 。 口 
4.7.6 LR 语法 分 析 表 的 压缩 

一 个 典型 的 具有 50 ~ 100 个 终结 符号 和 100 个 产生 式 的 程序 设计 语言 文法 的 LALR 语法 分 析 
表 中 可 能 包含 几 百 个 状态 。 分 析 表 的 动作 函数 常常 包含 20000 B TAA, 每 个 条 目 至 少 需要 8 个 
二 进 制 位 进行 编码 。 对 于 小 型 设备 , 有 一 个 比 二 维 数 组 更 加 高 效 的 编码 方法 是 很 重要 的 。 我 们 
将 简短 地 描述 一 些 可 以 用 于 压缩 LR 语法 分 析 表 中 的 ACTION 字段 和 COTO 字段 的 技术 。 

一 个 可 用 于 压缩 动作 字段 的 技术 所 基于 的 原理 是 动作 表 中 通常 有 很 多 相同 的 行 。 比 如 ,图 
4-42 中 的 状态 0 和 3 就 有 相同 的 动作 条 目 , 状态 2 和 6 也 是 这 样 。 因 此 ,如 果 我 们 为 每 个 状态 创建 
一 个 指向 一 维 数组 的 指针 , 我 们 就 可 以 节省 可 观 的 空间 ,而 付出 的 时 间 代 价 却 很 小 。 有 具有 相同 动 
作 的 状态 的 指针 指向 相同 的 位 置 。 为 了 从 这 个 数组 获取 信息 , 我 们 给 各 个 终结 符号 赋予 一 个 编 
号 ,编号 范围 为 从 零 开 始 到 终结 符号 总 数 减 一。 对 于 每 个 状态 , 这 个 整数 编号 将 作为 从 指针 值 开 
始 的 偏 移 量 。 在 一 个 给 定 的 状态 中 , 第 i 个 终结 符号 对 应 的 语法 分 析 动 作 可 以 在 该 状态 的 指针 值 
之 后 的 第 i 个 位 置 上 找到 。 ' 





这 个 列表 由 (终结 符号 , 动作 ) 对 组 成 。 一 个 状态 的 最 频繁 的 动作 可 以 放 在 列表 的 结尾 处 , 并 且 
我 们 可 以 在 这 个 对 中 原本 放 终 结 符号 的 地 方 放 上 符号 “any”, 表示 如 果 没 有 在 列表 中 找到 当前 
给 入, 那么 不 管 这 个 输入 是 什么 , 我 们 都 选择 这 个 动作 。 不 仅 如 此 , 为 了 使 得 一 行 中 的 内 容 更 加 
一 致 , 我 们 可 以 把 报错 条 目 安全 地 将 换 为 规约 动作 。 对 错误 的 检测 会 稍 有 延 后 , 但 仍 可 以 在 执行 
下 一 个 移入 动作 之 前 发 现 错误 。 

ees) 考虑 图 4.37 的 语法 分 析 表 。 首 先 , 请 注意 状态 0、4、6 和 7 的 动作 是 相同 的 。 我 们 可 
以 用 下 面 的 列表 来 表示 它们 : 








符号 ”动作 

id 85 

( s4 
any error 

状态 1 有 一 个 类 似 的 列表 : 

+ s6 

$ ace 
any error 


在 状态 2 中 , RME ERER HRA 2, 因此 对 于 除 * 之 外 的 输入 都 按照 产生 式 2 进行 
归 约 。 因 此 状态 2 的 列表 是 
s7 
any r2 
状态 3 只 有 报错 和 md 条 目 。 我 们 可 以 把 前 者 将 换 为 后 者 ， 因 此 状态 3 的 列表 只 有 一 个 对 
(any, r4) RÆ S, 10 和 11 也 可 以 做 类 似 处 理 。 状 态 8 的 列表 是 
i + s6 
) sll 


any error 
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而 状态 9 的 列表 是 


* s7 





any rl 

我 们 也 可 以 把 GOTO 表 编 码 为 一 个 列表 , 但 这 里 更 加 高 效 的 方法 是 为 每 个 非 终 结 符号 4 构造 

一 个 数 对 的 列表 。4 的 列表 中 的 每 个 对 形 如 (当前 状态 ,下 一 状态 ) ,表示 
GOTO, 当前 状态 , A] = 下 一 状态 

这 个 技术 很 有 用 , 因为 COTO 表 的 一 列 中 常常 只 有 很 少儿 个 状态 。 原 因 是 对 于 某 个 非 终 结 符 
号 4 上 的 GOTO 目标 状态 的 项 集中 必然 存在 某 些 项 ， 这 些 项 中 4 紧 舍 在 点 的 左边 。 对 于 任意 两 个 
不 同 的 文法 符号 XX、Y, 没有 哪个 COTO 目标 项 集 既 有 点 左边 为 X 的 项 ， ee E 因 
此 , 每 个 状态 最 多 只 出 现在 COTO 表 的 一 列 中 。 

为 了 进一步 减少 使 用 的 空间 , 我 们 注意 到 COTO 表 中 的 报错 条 目 从 来 都 不 会 被 查询 到 。 因 
此 ,我 们 可 以 把 每 个 报错 条 目 替换 为 该 列 中 最 常用 的 非 报错 条 目 。 这 个 条 目 变 成 了 默认 选择 。 在 
每 一 列 的 列表 中 , 它 被 表示 为 一 个 “当前 状态 ”字段 为 any 的 对 。. 
eee eR 437, FATRIS RET 对 应 的 条 目 是 10, 所 有 其 他 的 条 目 所 对 应 
的 要 么 是 3 要 人 么 报错 。 我 们 可 以 用 3 来 替换 报错 条 目 , 为 列 创建 列表 

当前 状态 下 一 状态 


类 似 地 , 了 列 的 列表 可 以 是 
6 9 
any 2 
对 于 五 列 , 我 们 可 以 选择 1 或 8 作为 默认 选择 。 这 两 种 选择 都 需 要 两 个 列表 条 目 。 比 如 , 我 
们 可 以 为 五 列 创建 如 下 列表 
4 8 
any 1 
这 些小 例子 中 体现 出 来 的 空间 节省 效果 可 能 具有 误导 性 。 因 为 在 这 个 例子 和 前 一 个 例子 中 
创建 的 列表 中 的 条 目 数量 ,再 加 上 从 状态 到 动作 列表 的 指针 以 及 从 非 终结 符号 到 后 继 状 态 表 的 
指针 , 它们 需要 的 空间 和 图 4-37 中 的 矩阵 实现 方法 相 比 , 并 没有 令 人 印象 深刻 的 空间 节省 效果 。 
但 是 对 于 现实 中 的 文法 , 列表 表示 法 所 需要 的 空间 通常 比 矩 阵 表示 法 所 需 空间 少 10% 。 在 3.9.8 
节 中 讨论 的 用 于 有 穷 自 动机 的 表 压 缩 方 法 也 可 以 用 来 表示 LR 语法 分 析 表 。 
4.7.7 4.7 节 的 练习 
练习 4.7. 1: 为 练习 4.2.1 的 文法 SS+155* 1a 构 造 
1) 规范 LR 项 集 族 。 
2) LALR 项 集 族 。 
练习 4.7. 2: 对 练习 4.2.2(1) _ (7) 的 各 个 ( 增 广 ) 文法 重复 练习 4.7.1。 
! 练习 4.7.3: 对 练习 4.7.1 的 文法 ,使 用 算法 4. 63, 根据 该 文法 的 LTR(0) 项 集 的 内 核 构造 
出 它 的 LALR 项 集 族 。 
! 练习 4.7.4; 说 明 下 面 的 文法 
So-AaibActdclbda 
Ad 


L 
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是 LALR(1) 的 , 但 不 是 SLR(1) 的 。 
1 练习 4.7.5: 说 明 下 面 的 文法 
SoAalbAc|IBclbBa 
A->d 
B--+d 
是 LR(1) 的 , 但 不 是 LALR(1) 的 。 
4.8 使 用 二 义 性 文法 
实际 上 ,每 个 二 义 性 文法 都 不 是 LR 的 , 因此 它们 不 在 前 面 两 节 讨 论 的 任何 文法 类 之 内 。 然 
it, 某 些 类 型 的 二 义 性 文法 在 语言 的 规约 和 实现 中 很 用。 对 于 像 表 达 式 这 样 的 请 言 构造 ,二 义 
性 文法 能 提供 比 任 何等 价 的 无 二 义 性 文法 更 短 、 更 自然 的 规约 。 二 义 性 文法 的 男 一 个 用 途 是 隔 
离 经 常 出 现 的 语法 构造 , 以 对 其 进行 特殊 的 优化 。 使 用 二 义 性 文法 , 我 们 可 以 向 文法 中 精心 加 入 
新 的 产生 式 来 描述 特殊 情况 的 构造 。 i 
虽然 使 用 的 文法 是 二 义 性 的 , 但 我 们 在 所 有 的 情况 下 都 会 给 出 消除 二 义 性 的 规则 , 使 得 每 个 
句子 只 有 一 棵 语法 分 析 树 。 通 过 这 个 方法 , 语言 的 规约 在 整体 上 是 无 二 义 性 的 , 有 时 还 可 以 构造 
出 遵循 这 个 二 义 性 解决 方法 的 LR 语法 分 析 器 。 我 们 强调 应 该 保守 地 使 用 二 义 性 构造 , 并 且 必 须 
在 严格 控制 之 下 使 用 , 否则 无 法 保证 一 个 语法 分 析 器 识别 的 到 底 是 什么 样 的 语言。 
4.8.1 用 优先 级 和 结合 性 解决 冲突 
考虑 带 有 运算 符 + 和 * 的 有 二 义 性 的 表达 式 文法 (4.3)。 为 方便 起 见 , 这 里 再 次 给 出 此 
文法 : 











EE +EIE«EI(E)lid 
这 个 文法 是 二 义 性 的 , 因为 它 没有 指明 运算 符 + 和 * 的 优先 级 和 结合 性 。 无 二 义 性 的 文法 (4.1) ( 包 
SPER ESE + TAITOT * 天 生成 同样 的 语言 , 但 是 指定 + 的 优先 级 低 于 * , 并 且 两 个 运算 符 





都 是 左 结合 的 。 出 于 两 个 原因 ,我 们 愿意 使 用 人 
这 个 二 义 性 文法 。 第 一 , 我 们 将 会 看 到 的 , 可 B+ E+E En -E+E 
但 从 see x š i E> E*xE E~ E+E 
以 很 容易 地 改变 运算 符 + 和 * 的 优先 级 和 结 E => (E) E => -(B) 
合 性 ， 既 不 需要 修改 文法 (4.3 ) 的 产生 式 , 也 E= id E> id 
不 需要 改变 相应 语法 分 析 器 的 状态 数目 。 第 h: Bak: Ig: E> (E) 
Z, 相应 无 二 义 性 文法 的 语法 分 析 器 将 把 部 分 Ae ee es 
时 间 用 于 归 约 产生 式 ET ATF, 这 两 个 
产生 式 的 功能 就 是 保证 结合 性 和 优先 级 。 二 0 Ae een 
义 性 文法 (4. 3) 的 语法 分 析 器 不 会 把 时 间 浪 费 E> -ExE Es E+E 
在 对 这 些 单产 生 式 ( 即 产生 式 体 中 只 包含 一 个 fn cies a 
非 终结 符号 的 产生 式 ) 的 归 约 上 。 TERES a 
使 用 E' 一 E 增 广 之 后 的 二 义 性 表达 式 文 四 
法 (4.3) 的 LR(0) 项 集 显示 在 图 4-48 中 。 因 We ue h: EB (E)- 
为 文法 (4.3 ) 是 二 义 性 的 , 在 我 们 试图 用 这 些 B+ -E+E 
项 集 生成 一 个 LR 语法 分 析 表 时 会 出 现 分 析 动 EI 





作 冲 突 。 对 应 于 项 集 A 的 两 个 状态 就 产 
生 了 这 样 的 冲突 。 假 设 我 们 使 用 SLR 方法 来 图 4-48 一 个 增 广 表达 式 文法 的 LR(0) 项 集 
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构造 语法 分 析 动 作 表 。77 在 输入 + 或 * 上 产生 了 冲突 , 不 能 确定 应 该 按照 EE +E 归 约 还 是 应 该 
移 人 。 这 个 冲突 无 法 解决 , 因为 + 和 * 都 在 FOLLOW (五 ) 中 。 央 此 在 输入 为 * 或 + 时 , 这 两 种 动作 
都 被 要 求 执行 。A 也 产生 了 类 似 的 冲突 , 即 在 输入 为 + 或 * 时 , 不 能 确定 应 该 按照 EE + E HAE 
是 应 该 移 人 。 实 际 上 ，, 任意 一 种 LR 语法 分 析 表 构造 方法 都 会 产生 这 样 的 冲突 。 
O Rm, 这 些 问 题 可 以 使 用 + 和 * 的 优先 级 和 结合 性 信息 来 解决 。 考 虑 输入 id + id * id, È 
使 得 基于 图 4- 48 的 语法 分 析 器 在 处 理 完 id + id 之 后 进入 状态 7。 更 明确 地 说 , 语法 分 析 器 进入 
如 下 的 格局 : 
前 级 栈 输入 
E+E 0147 * id $ 

为 方便 起 见 , 我 们 同时 将 对 应 于 状态 1、4 和 7 的 符号 显示 在 “前 缀 " 列 中 。 

如 果 * 的 优先 级 高 于 +, 我 们 知道 语法 分 析 器 应 该 将 * 移入 栈 中 , 准备 将 这 个 * 和 它 两 边 的 
i 符号 归 约 为 一 个 表达 式 。 图 4-37 显示 了 根据 等 价 的 无 二 义 性 文法 得 到 的 SLR 语法 分 析 器 。 这 
个 分 析 器 也 做 出 同样 的 选择 。 另 一 方面 , 如 果 + 的 优先 级 高 于 * ,我们 知道 语法 分 析 器 应 该 将 
+E 归 约 为 &。 因 此 ,+ 和 * 之 间 的 相对 优先 关系 可 以 被 用 于 解决 状态 7 上 的 冲突 , 确定 在 输入 
* 上 应 该 按照 E+E 归 约 还 是 应 该 移入 。 

假如 输入 是 ia + id +id , 语法 分 析 器 在 处 理 了 输入 ia + id ZI, 仍然 能 获得 栈 内 容 为 
0 147 的 格局 。 在 输入 为 + 时 , 状态 7 中 仍然 有 一 个 移 人 / 归 约 冲突 。 然 而 , 现在 运算 符 + 的 结 
合 性 可 以 决定 如 何 解决 这 个 冲突 。 如 果 + 是 左 结合 的 , 正确 的 动作 是 按照 ESE +E 进行 妇 约 。 
也 就 是 说 , 第 一 个 + 号 两 边 的 记 必须 被 分 在 一 组 。 这 个 选择 仍然 和 相应 无 二 义 性 文法 的 SLR 语 
法 分 析 器 的 做 法 一 致 。 

概括 地 讲 , 假设 + 是 左 结合 的 , 状态 7 在 输入 + 时 的 动作 应 该 是 按照 E 一 E+ 进行 归 约 。 假 
设 * 的 优先 级 高 于 +， 状态 7 在 输入 * 上 的 动作 应 该 是 移 人 。 类 似 地 , 假设 * 是 左 结合 的 , 并 且 
它 的 优先 级 高 于 + 。 因 为 只 有 当 栈 中 最 上 端的 三 个 




















ASR EER, 状态 8 才能 出 现在 栈 顶 。 我 们 可 以 | RE H -r E So 

认为 状态 8 在 输入 * 和 + 上 的 动作 都 是 按照 E 一 玉 * ale 5 

EH, MPRA + NE, 理由 是 * 的 优先 级 高 1 s4 s5 ace 

于 +; 而 对 于 输入 为 * 的 情况 ,理由 是 * 是 左 结 | 3 auan nual 

合 的 。 4 | s3 s2 7 
按照 这 个 方式 进行 处 理 , 我 们 可 以 得 到 图 4-49 | e ws” a | 

所 示 的 LR 语法 分 析 表 。 产 生 式 1 ~4 分 别 是 : ae ae 

E>E +E, E>E*«xE, E>( E)M Eid, 很 有 意思 9 r3 r3 r3 r3 














的 是 , 如 果 从 图 4-37 所 示 的 无 二 义 性 表达 式 文法 
(4.1) 的 SLR 分 析 表 中 删除 单产 生 式 王 一 T Al TF 
的 归 约 动作 , 我 们 可 以 得 到 一 个 相似 的 语法 动作 表 。 在 使 用 LALR 和 规范 LR 语法 分 析 技 术 时 ， 
我 们 也 可 以 使 用 类 似 的 方法 来 处 理 这 种 二 义 性 文法 。 
4.8.2 “悬空 -else” 的 二 义 性 

再 次 考虑 下 面 的 条 件 语句 文法 : 


stmt —if expr then stmi else stmt 


图 4-49 文法 (4.3) 的 语法 分 析 表 


| if expr then stmt 


| other 
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如 我 们 在 4. 3. 2 节 中 指出 的 ,这 个 文法 是 二 义 性 的 , 因为 它 没 有 解决 悬空 -else 的 二 义 性 问 
题 。 为 了 简化 这 个 讨论 , 我 们 考虑 这 个 文法 的 一 个 抽象 表示 , 其 中 i 表示 if expr then, e 表示 else, 
4 表示 “所 有 其 他 的 产生 式 ”。 那 么 我 可 以 用 增 广 产生 式 S'S 重 写 这 个 文法 ; 














S'S 
S-iSeSliSia (4. 67) 
SCH (4. 67) AY LR(0) 项 集 显 示 在 图 4-50 中 。 央 为 文法 (4.67) 的 二 义 性 , 在 14 中 有 一 个 
BA AAA, TANAR, SiS > eS 要 求 : 
F: [s : reer ere í Io: S'S Ts: Sra 
Kee BA, 又 因为 FOLLOW(S) =ie, $], MS S > iSeS | 
-iSe EREMAN e 的 时 候 用 SiS 进行 = iS Is: ae oe 
归 约 he Sises 
ae 、 sy $ ini h: =S- S ~> iSeS 
把 这 些 讨 论 翻 译 回 if-then-else 的 术语 ， 假 F448 
“SLE By Ig: S Ses : 
设 栈 中 内 容 为 Sa 
if expr then simt S 一 iSeS l: S — ises- 
J pn A Spy .. S73 -iS 
且 else 是 第 一 个 输入 符号 , 我 们 应 该 将 else a Sy 
BAR PBIB A e) UE? 还 是 应 该 将 证 expr = 
then stmt 归 约 ( 即 按照 5 一 i5 妇 约 ) 呢 ? 管 案 ASO 增 /文法 (4.67) 的 LR(0) 状 态 


是 我 们 应 该 移 人 else, 因为 它 是 和 前 一 个 then“ 相 关 ” 的 。 按 照 文 法 (4.67) 的 术语 , 输入 中 
代表 else 的 e。 只 能 作为 以 交 开 头 的 产生 式 体 的 一 部 分 , 而 现在 栈 顶 内 容 就 是 iSo WRA 
中 跟 在 e 后 面 的 符号 不 能 被 归 约 为 5, 使 得 分 析 器 无 法 归 约 得 到 完整 的 产生 式 体 iSeS, 那么 
可 以 证 明 别 的 语法 分 析 过 程 也 不 可 能 得 到 这 个 产生 式 体 。 

我 们 可 以 确定 在 解决 h 中 的 移入 / 归 约 冲突 时 应 该 在 输入 为 e 时 执行 移 人 动作 。 使 用 这 个 方 
TR l, 在 输入 e 上 的 语法 分 析 动 作 冲 突 之 后 , 根据 图 4-50 的 项 集 构造 得 到 的 SLR 语法 分 析 
家 显示 在 图 4-51 中 。 产 生 式 1 ~3 分 别 是 SyiSeS、S 一 iS 和 Sa, 

比如 ,在 处 理 输 入 iiaea 时 , 根据 正确 的 “悬空 -else” 冲 帘 的 解决 方法 , 语法 分 析 器 执行 了 图 
4-52 中 所 示 的 步骤 。 在 第 5 行 , 状态 4 在 输入 e 上 选择 了 移入 动作 ; 而 在 第 9 行 ,状态 4 在 输 
人 有 $ 上 要 求 按照 Sis 进行 归 约 。 
























































z tt 符号 | 输入 | 动作 | 
fi KK ACTION | GOTO G) 0 tiaea$ | HA 
S oE A F 5 (2) 02 i iaea$ | BA 
(3) 022 ii aca$ | BA 
i R l (4) 0223 liia eas | 根据 S > ala?) 
i acr (5) 0224 iis ea$ | BA 
2 82 s3 4 (6) 02245 iise a$ | BA 
3 ne r3 (7) 022453 |iiSea $ | 根据 S -oa 归 约 
4 5 r2 (8) 022456|iiSeS $ | 根据 5 > ises 144 
5 82 s3 6 (9) 024 is $ | 根据 S > 125 归 约 
6 rl rl (10) 01 S $ | 接受 
图 4-51 悬空 else 文法 的 LR 分 析 表 El 4-52 处 理 和 输入 iaca 时 的 语法 分 析 动 作 
我 们 做 一 个 比较 ,如果 我 们 不 能 使 用 二 义 性 文法 来 描述 条 件 语句 ,那么 我 们 将 不 得 不 使 用 例 


4.16 中 给 出 的 笨拙 的 文法 来 描述 。 
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4.8.3 LR 语 法 分 析 中 的 错误 恢复 

当 LR 语法 分 析 器 在 查询 语法 分 析 动 作 表 并 发 现 一 个 报错 条 目 时 ， 它 就 检测 到 了 一 个 语法 错 
误 。 在 查询 COTO 表 时 不 会 发 现 语法 错误 。 如 果 当 前 已 扫描 的 输入 部 分 不 可 能 存在 正确 的 后 续 
eA, LR 语法 分 析 器 就 会 立刻 报错 。 规 范 LR 语法 分 析 器 不 会 做 任何 多 余 的 归 约 动作 , 会 立刻 
报告 错误 。SLR 和 LALR 语法 分 析 器 可 能 会 在 报错 之 前 执行 几 次 归 约 动作 , 但 是 它们 决 不 会 把 一 
个 错误 的 输入 符号 移入 到 栈 中 。 

在 LR 语法 分 析 过 程 中 , 我 们 可 以 按照 如 下 方式 实现 恐慌 模式 的 错误 恢复 策略 。 我 们 从 栈 项 
向 下 扫描 ,直到 发 现 某 个 状态 s, 它 有 一 个 对 应 于 某 个 非 终结 符号 4 的 COTO Hix, ARNE 
弃 零 个 或 多 个 输入 符号 , 直到 发 现 一 个 可 能 合法 地 跟 在 4 之 后 的 符号 a 为止。 之 后 语法 分 析 器 将 
GOTO(s, 4) 压 人 栈 中 , 继续 进行 正常 的 语法 分 析 。 在 实践 中 可 能 会 选择 多 个 这 样 的 非 终结 符号 
4。 通常 这 些 非 终结 符号 代表 了 主要 的 程序 段 ， 比 如 表达 式 、 请 名 或 块 。 比 如 ,如 果 4 是 非 终结 
符号 stmt, a 就 可 能 是 分 号 或 者 | 。 其 中 ,| 标记 了 一 个 语句 序列 的 结束 。 


包含 错误 。 这 个 串 的 一 部 分 已 经 被 处 理 , 并 形成 了 栈 顶 部 的 一 个 状态 序列 。 这 个 串 的 其 余部 分 
还 在 输入 中 , 语法 分 析 器 则 在 输入 中 查找 可 以 合法 地 跟 在 4 后 面 的 符号 ,从 而 试图 跳 过 这 个 串 的 
其 余部 分 。 通 过 从 栈 中 删除 状态 , 跳 过 一 部 分 输入 , 并 将 GOTO(s, 4) 压 人 栈 中 , 语法 分 析 器 假 
装 它 已 经 找到 了 4 的 一 个 实例 , 并 继续 进行 正常 的 语法 分 析 。 

实现 短语 层次 错误 恢复 的 方法 如 下 :检查 LR 语法 分 析 表 中 的 每 个 报错 条 目 , 并 根据 语 
言 的 使 用 方法 来 决定 程序 员 所 犯 的 何 种 错误 最 有 可 能 引起 这 个 语法 错误 。 然 后 构造 出 适当 
的 恢复 过 程 , 通常 会 根据 各 个 报错 条 目 来 确定 适当 的 修改 方法 ,修改 栈 顶 状态 和 /或 第 一 个 
答 入 符号 。 

在 为 一 个 LR 语法 分 析 器 设计 专门 的 错误 处 理 例 程 时 , 我 们 可 以 在 表 的 动作 字段 的 每 个 空 条 
目 中 填写 一 个 指向 错误 处 理 例 程 的 指针 。 该 例 程 将 执行 编译 器 设计 者 所 选 定 的 恢复 动作 。 这 些 
动作 包括 在 栈 和 /或 输入 中 删除 或 插 和 人 符号 , 也 包含 替换 输入 符号 或 将 输入 符号 换 位 。 我 们 必须 
着 慎 地 做 出 选择 , 避免 LR 语法 分 析 器 陷入 无 限 循环 。 一 个 安全 的 策略 是 保证 最 终 至 少 有 一 个 输 
入 符号 被 删除 或 移入 , 并 且 如 果 到 达 输 入 结束 位 置 时 要 保证 栈 会 缩小 。 应 该 避免 从 栈 中 弹出 一 
个 和 某 非 终 结 符号 对 应 的 状态 , 因为 这 样 的 修改 相当 于 从 栈 中 消除 了 一 个 已 经 被 成 功 分 析 的 语 
言 构造 。 























再 次 考虑 表达 式 文 法 ACTION Goro | 
E-E +EIE*EI(E)Iid id +s ( ) 5| BE 

图 4- 49 中 显示 了 这 个 文法 的 LR 分 析 表 。 图 | 1 | 

4-53 中 显示 的 是 对 这 个 分 析 表 进行 修改 后 得 到 的 语 | 2 ls el el s2 e el | 6 

法 分 析 表 。 修 改 后 的 表 添 加 了 错误 检测 和 恢复 的 动 | pS ee em] ， 

作 。 对 于 那些 在 某 些 输入 上 执行 特定 归 约 动作 的 状 : > a z a i 8 

态 , 我 们 将 这 个 状态 中 的 报错 条 旭 震 换 为 这 个 归 约 7 Ji rl sr rl al 

动作 。 这 种 修改 可 能 会 使 得 报错 延 后 至 一 次 或 多 次 | 8 (8 2 2 2 2 2 

归 约 动作 之 后 , 但 是 错误 仍然 会 在 任何 移 人 动作 发 

生 之 前 被 发 现 。 图 4- 49 中 剩余 的 空白 项 已 经 被 葵 图 4.53 ， 带 有 错误 处 理子 

换 为 对 错误 处 理 与 过 程 的 调用 。 程序 的 LR 语法 分 析 表 


错误 处 理 例 程 如 下 : 
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el: 这 个 例 程 在 状态 0、2、4 和 5 上 被 调用 。 所 有 这 些 状态 都 期 望 读 入 一 个 运算 分 量 的 第 一 
个 符号 , 这 个 符号 可 能 是 id 或 左 括号 , 但 是 实际 读 人 的 却 是 + 、* 或 输入 结束 标记 。 

将 状态 3( 状 态 0、2、4 和 5 在 输入 jf 上 的 GOTO 目标 ) 压 入 栈 中 ; 

发 出 诊断 信息 “缺少 运算 分 量 。” 

e2: 在 状态 0、1、2、4 和 5 上 发 现 输 入 为 右 括 号 时 调用 这 个 过 程 。 

从 输入 中 删除 右 括 号 ; 

发 出 诊断 信息 “不 匹配 的 右 括号 。 

e3: 当 在 状态 1 和 6 L, 期 待 读 人 一 个 运算 符 却 发 现 了 一 个 id 或 左 括号 时 调用 。 


























将 状态 4( 对 应 于 符号 + 的 状态 ) BA $E 符号 ”| 输入 
栈 中 。 : a id ee 
发 出 诊断 信息 “缺少 运算 符 。 01 E +)8 
A: 当 在 状态 6 上 发 现 输入 结束 标记 时 | 014 | Pt 
调用 。 ‘1014 E+ S| ikbar” 
HRA OME RES) BARES |0113 ee 
发 出 诊断 信息 “缺少 右 括号 。 0147 
在 处 理 错误 的 输入 id + ) 时 , 语法 分 OU 
析 器 进入 的 格局 序列 显示 在 图 4-54 中 。 O 图 4-54 ”一 个 LR 语法 分 析 器 所 做 
4.8.4 4.8 节 的 练习 的 语法 分 析 和 错误 恢复 步骤 


| 练习 4.8.1: 下 面 是 一 个 二 义 性 文 
法 , 它 描述 了 包含 n 个 二 目 中 缀 运算 符 且 具有 个 不 同 优先 级 的 表达 式 : 
ESEQOEIEOE|I...|IE0EI(E)lid 
1) 将 SLR 项 集 表示 为 n 的 函数 。 
2) 要 使 得 所 有 的 运算 符 都 是 左 结合 的 , 并 且 6 的 优先 级 高 于 0, 6. 的 优先 级 高 于 03, 依次 
类 推 , 我 们 应 该 如 何 解决 SLR 项 之 间 的 冲突 ? 








3) 根据 你 在 (2) 中 的 决定 ,给 出 相应 的 SLR 语法 分 [局 Bem) 
析 表 。 Ez = Ez On- Es | Es 

4) 图 4-55 中 的 无 二 义 性 文法 定义 了 相同 的 表达 式 集合 。 | m 4 BOE | Eon 
对 这 个 文法 重复 (1) 和 (3 ) 部 分 。 Eni > (B&B)lid 





5) 比较 这 两 个 (二 义 性 和 无 二 义 性 ) 文 法 的 项 集 总 数 以 fae ere 
及 它们 的 语法 分 析 表 的 大 小 ,你 能 得 出 什么 结论 ? 关于 二 义 MAS AA n MERAN 
性 表达 式 文法 的 使 用 , 这 个 比较 结果 告诉 我 们 什么 信息 ? 和 

| 练习 4. 8.2: 图 4-56 给 出 了 某 种 语句 的 文法 。 这 些 语句 和 练习 4. 4. 12 中 讨论 的 语句 类 似 。 
TRE, e Als 仍然 是 分 别 代表 条 件 表 达 式 和 “其 他 语句 ”的 终结 符号 。 

1) 为 这 个 文法 构造 一 个 LR 语法 分 析 表 ,并 用 解决 县 
空 -else 问 题 的 常用 方法 来 解决 其 中 的 冲突 。 

2) 在 这 个 语法 分 析 表 中 填 人 额外 的 归 约 动作 或 适当 的 
错误 恢复 例 程 , 实现 语法 分 析 中 的 错误 恢复 。 

3) 给 出 你 的 语法 分 析 器 在 处 理 下 列 输入 时 的 行为 : at 

@ if e then s ; if e then s end 

D while e do begin s ; if e then s ; end El 4-56 HAEA 





simt -= if e then stmt 
| ife then stmt else stmt 
| while edo stmt 
| begin list end 
| s 
-> list; stmt 
| stmt 














3 


开始 构造 这 个 桌 上 计算 器 : 
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4.9 ”语法 分 析 器 生成 工具 


本 节 将 介绍 如 何 使 用 语法 分 析 器 生成 工具 来 帮助 构造 一 个 编译 器 的 前 端 。 我 们 将 使 用 LALR 
语法 分 析 器 生成 工具 Yace 作为 我 们 讨论 的 基础 ， 因 为 它 实现 了 我 们 在 前 两 节 中 讨论 的 很 多 概念 ， 
并 且 这 个 工具 很 容易 获得 。Yacc 表示 “yet another compiler-compiler”,， 即 “又 一 个 编译 器 的 编译 
器 ”。 这 个 名 字 反 映 出 当 S. C. Johnson 在 20 世纪 70 年 代 早期 创建 出 Yace 的 第 一 个 版 本 时 , 语法 
分 析 器 生成 工具 非常 流行 。Yace 在 UNIX 系统 中 是 以 命令 的 方式 出 现 的 , 它 已 经 用 于 实现 多 个 编 
译 器 产品 。 l 
4.9.1 语法 分 析 嚣 生成 工具 Yacc 

按照 图 4-57 中 演示 的 方法 就 可 以 使 用 Yacc 来 构造 一 个 翻译 器 。 首 先 要 准备 好 一 个 文件 ， 比 
如 translate. y, 文件 中 包含 了 对 将 要 构造 的 翻译 器 的 规约 。UNIX 系统 命令 


yacc translate.y 





Yacc 


使 用 算法 4.63 中 给 出 的 LALR 方法 将 文件 win 一 eee ee 
translate. y 转换 成 为 一 个 名 为 y. tab. c 的 C 程序 。 translate.y = 
程序 y tab. c 是 一 个 用 C 语言 编写 的 LALR 语法 分 y-tab.c — pigg [> a.out 


wet, 另外 还 包括 由 用 户 准备 的 C 语言 例 程 。 其 
中 的 LALR 分 析 表 是 按照 4.7 节 中 描述 的 方法 压 
缩 的 。 使 用 命令 a 图 4-57 H Yace 创建 一 个 输入 /输出 翻译 器 

cc y.tab.c -ly 
对 y tab. c 进行 编译 , 并 和 包含 LR 语法 分 析 程 序 的 库 ly 连接 , 我 们 就 得 到 了 想 要 的 目标 程序 
a. out。 这 个 程序 执行 了 由 最 初 的 Yace 程序 translate. y 所 描述 的 翻译 工作 。 如 果 需 要 其 他 过 程 ， 
它们 可 以 和 其 他 的 C 程序 一 样 ， 和 y tab. e 一 起 编译 并 加 载 。 

一 个 Yace 源 程序 由 三 个 部 分 组 成 : 

声明 

hh 

翻译 规则 

4, 


输入 一 一 ”| aout ~ fh 























hh 

辅助 性 C 语言 例 程 
RRR 为 了 说 明 如 何 编写 一 个 Yace WEF, 我 们 构造 一 个 简单 的 桌 上 计算 器 。 该 计算 器 读 
入 一 个 算术 表达 式 , 对 表达 式 求 值 , 然后 打印 出 表达 式 的 结果 。 我 们 将 从 下 面 的 算术 表达 式 文法 


E>E + TIT 
ToT * FIF 
F—( E ) | digit | 
其 中 的 词法 单元 digit 是 一 个 0 ~9 之 间 的 数字 。 根 据 这 个 文法 得 到 的 Yace 桌 上 计算 器 程序 显示 
在 图 4-58 中 。 口 
声明 部 分 
一 个 Yacc 程序 的 声明 部 分 分 为 两 节 , 它 们 都 是 可 选 的 。 在 第 一 节 中 放置 通常 的 C 声明 , 这 个 
声明 用 % | 和 } 多 括 起 来 。 那 些 由 第 二 和 第 三 部 分 中 的 翻译 规则 及 过 程 使 用 的 临时 变量 都 在 这 里 








O 函数 库 的 名 字 ly 和 具体 系统 相关 。 
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声明 。 在 图 4-58 中 , 这 一 节 只 包含 include 语句 

#include <ctype.h> 
这 个 语句 使 得 C 语言 的 预 处 理 器 将 标准 头 文件 < ctype.h > 包含 进来 ,这 个 头 文件 中 包含 了 断言 
isdigit, | 

在 声明 部 分 中 还 包括 对 词法 单元 的 声明 。 在 图 4-$8 中 , 语句 

%token DIGIT 
声明 DIGIT 是 一 个 词法 单元 。 在 这 一 节 中 声明 的 词法 单元 可 以 在 Yace 规约 的 第 二 和 第 三 部 分 
中 使 用 。 如 果 向 Yace 语法 分 析 器 传送 词法 单元 的 词法 分 析 器 是 使 用 Lex 创建 的 , 那么 如 3.5.2 
节 中 讨论 的 ，Lex 生成 的 词法 分 析 器 也 可 以 使 用 这 里 声明 的 词法 单元 。 





af 

#include <ctype.h> 

A} 

Atoken DIGIT 

hh 

line : expr '\n' { printf("4d\n", $1); } 

expr: expr'+' term { $$ = $1 + $3; } 
| term 

term : term '*' factor { $$ = $1 * $3; } 
| factor 

factor : '(' expr ')' { $$ = $2; } 
| DIGIT 

hh 

yylex() { 


int c; 

c = getchar(); 

if (isdigit(c)) { 
yylval = c-'0'; 
return DIGIT; 

} 


return c; 











图 4-58 一 个 简单 的 桌 上 计算 器 的 Yace 规约 


翻译 规则 部 分 
我 们 将 翻译 规则 放置 在 Yace 规约 中 第 一 个 %% 对 之 后 的 部 分 。 每 个 规则 由 一 个 文法 产生 式 
和 一 个 相关 联 的 语义 动作 组 成 。 我 们 前 面 写 作 
< 产生 式 头 > 一 < 产生 式 体 >11 <PERR >l … | < 产生 式 体 >， 
的 一 组 产生 式 在 Yace 中 被 写成 ; 
< 产生 式 头 > : < FERE >| < 语义 动作 > 1| 
i < PERIE >f < 语义 动作 >,| 


| < 产生 式 体 > ,| < 语义 动作 >,| 


在 一 个 Yace 产生 式 中 , 如 果 一 个 由 字母 和 数位 组 成 的 字符 串 没 有 加 引号 且 未 被 声明 为 词法 
单元 , 它 就 会 被 当 作 非 终结 符号 处 理 。 带 引号 的 单个 字符 ,比如 “c', 会 被 当 作 终结 符号 c 以 及 
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它 所 代表 的 词法 单元 所 对 应 的 整数 编码 ( 即 Lex 将 把 ‘c ?的 字符 编码 当 作 整数 返回 给 语法 分 析 
器 ) 。 不 同 的 产生 式 体 用 竖 线 分 开 , 每 个 产生 式 头 以 及 它 的 可 选 产生 式 体 及 语义 动作 之 后 跟 一 个 
分 号 。 第 一 个 产生 式 的 头 符号 被 看 作 开始 符号 。 

一 个 Yace 语义 动作 是 一 个 C 语句 的 序列 。 在 一 个 语义 动作 中 , 符号 $$ 表示 和 相应 产生 式 头 
的 非 终结 符号 关联 的 属性 值 ,而 来 表示 和 相应 产生 式 体 中 第 ;个 文法 符号 (终结 符号 或 非 终结 符 
号 ) 关 联 的 属性 值 。 当 我 们 按照 一 个 产生 式 进 行 归 约 时 就 会 执行 和 该 产生 式 相 关联 的 语义 动作 ， 
因此 语义 动作 通常 根据 & 的 值 来 计算 $8 的 值 。 在 上 面 的 Yace 规范 中 , 我 们 将 两 个 五 产生 式 

E>E + 了 | 了 














和 它们 的 相关 语义 动作 写作 : 
expr : expr '+' term { $$ = $1 + $3; } 
| term 


请 注意 , 第 一 个 产生 式 中 的 非 终结 符号 term 是 该 产生 式 体 中 的 第 三 个 文法 符号 , 而 + 是 第 
二 个 文法 符号 。 与 第 一 个 产生 式 关联 的 语义 动作 将 产生 式 体 中 的 expr 和 term 的 值 相 加 , 并 把 
结果 赋 给 产生 式 头 上 的 非 终结 符号 expr。 我 们 省 略 了 第 二 个 产生 式 的 语义 动作 , 因为 对 于 体 中 
只 包含 一 个 文法 符号 的 产生 式 , 默认 的 语义 动作 就 是 找 贝 属性 值 。 总 的 来 说 ， 默 认 动作 是 1 $ S$ 
=$1; |}. 

请 注意 ,我 们 向 这 个 Yace 规范 中 加 入 了 一 个 新 的 开始 符号 产生 式 

line : expr '\n' { printf ("%/d\n", $1); } 

这 个 产生 式 说 明 桌 面 计算 器 的 输入 是 一 个 跟着 换行 符 的 表达 式 。 和 这 个 产生 式 相关 的 语义 
动作 打印 出 了 输入 表达 式 的 十 进 制 取 值 和 一 个 换行 符 。 

辅助 性 C 语言 例 程 部 分 

一 个 Yace 规约 的 第 三 部 分 由 辅助 性 C 语言 例 程 组 成 。 这 里 必须 提供 一 个 名 为 yylex( ) 的 
词法 分 析 嚣 。 用 Lex 来 生成 yylex( ) 是 一 个 常用 的 选择 , 见 4.9.3 节 。 在 需要 时 可 以 添加 错误 
恢复 例 程 这 样 的 过 程 。 

词法 分 析 器 yylex( ) 返 回 一 个 由 词法 单元 名 和 相关 属性 值 组 成 的 词法 单元 。 如 果 要 返回 一 
个 词法 单元 名 字 , 比如 DIGIT, 那么 这 个 名 字 必 须 先 在 Yace 规约 的 第 一 部 分 进行 声明 。 一 个 词法 
单元 的 相关 属性 值 通过 一 个 Yace 定义 的 变量 vylval 传送 给 语法 分 析 器 。 

图 4-58 中 的 词法 分 析 器 是 非常 原始 的 。 它 使 用 C 函数 getchar( ) 逐 个 读 人 字符 。 如 果 字 
符 是 一 个 数位 , 这 个 数位 的 值 就 存放 在 变量 yylval F, 返回 词法 单元 的 名 字 DIGIT, BM, F 
符 本 身 被 当 作 词法 单元 名 返回 。 
4.9.2 使 用 带 有 二 义 性 文法 的 Yacc 规约 

现在 让 我 们 修改 这 个 Yace MA, 使 得 这 个 桌面 计算 器 更 加 有 用 。 首 先 , 我 们 将 允许 桌面 计 
算 器 对 一 个 表达 式 序列 进行 求 值 ,其 中 每 个 表达 式 占 一 行 。 我 们 还 将 允许 表达 式 之 间 出 现 空 行 。 
我 们 将 第 一 个 规则 修改 为 : 

lines : lines expr '\n' { printf("4g\n", $2); } 


| lines '\n' 
| /* empty */ 


在 Yace 中 , 像 第 三 行 那样 的 空白 产生 式 表示 e。 

其 次 , 我 们 将 扩展 表达 式 的 种 类 , 使 得 它 的 语言 可 以 包含 数字 ,而 不 是 单个 数位 ， 并 且 包 含 
算术 运算 符 + 、- (包括 双 目 和 单 目 ) 、* 和 /。 描 述 这 类 表达 式 的 最 容易 的 方式 是 使 用 下 面 的 二 
义 性 文法 : 
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ESE +E\E-E\E* E|E/E| -E1(E) | number 
得 到 的 Yace 规约 如 图 4-59 所 示 。 





ut 

#include <ctype.h> 

#include <stdio.h> 

#define YYSTYPE double /* double type for Yacc stack */ 
ht 

%token NUMBER 


Wleft '+' '-! 
left nki '/' 
Yright UMINUS 
hh 


lines : lines expr '\n' { printf("%g\n", $2); } 
lines '\n' 


| /* empty */ 
expr : expr '+' expr { $$ = $1 + $3; } 
| expr '-' expr { $$ = $1 - $3; } 
| expr '*' expr { $$ = $1 * $3; } 
| expr '/' expr { $$ = $1 / $3; } 
| '(' expr ')' { $$ = $2; } 
| '-' expr %prec UMINUS { $$ = - $2; } 
| NUMBER g 
hh 
yylex() { 
int c; 
while ( ( c = getchar() ) ==! ' ); 
if ( (e == '.') |] Cisdigit(c)) ) { 
ungetc(c, stdin); 
scanf ("lf", &yylval); 
return NUMBER; 
} 
return c; 
} 








图 4-59 一 个 更 加 先进 的 桌 上 计算 器 的 Yacc 规约 


因为 图 4-59 中 Yace 规约 的 文法 是 二 义 性 的 ,LALR 算法 将 会 出 现 语法 分 析 动 作 冲突 。Yacc 
会 报告 产生 的 语法 分 析 动 作 冲 突 的 数量 。 使 用 -v 选项 调用 Yace 可 以 得 到 关于 项 集 和 语法 分 析 
动作 冲突 的 描述 。 这 个 选项 会 产生 一 个 附加 的 文件 y. output, 它 包 含 文法 的 项 集 的 内 核 , 对 
LALR 算法 产生 的 语法 分 析 动 作 冲 突 的 描述 , 以 及 LR 语法 分 析 表 的 一 个 可 读 表 示 形 式 。 这 个 可 
读 表示 形式 显示 了 Yace 是 如 何 解 决 这 些 语法 分 析 动 作 冲 突 的 。 只 要 Yace 报告 发 现 了 语法 分 析 
动作 冲突 , 那么 最 好 创建 并 查阅 y.output 文件 , 了解 为 什么 会 产生 这 些 语法 分 析 动 作 冲 突 , 并 
检查 Yace 是 否 已 经 正确 解决 了 它们 。 

除非 另行 指定 ,否则 Yacc 会 使 用 下 面 的 两 个 规则 来 解决 所 有 的 语法 分 析 动 作 冲突 : 

1) 解决 一 个 归 约 / 归 约 冲突 时 , 选择 在 Yace 规约 中 列 在 前 面 的 那个 冲突 产生 式 。 

2) 解决 移 人 / 妇 约 冲突 时 总 是 选择 移 人 。 这 个 规则 正确 地 解决 了 因为 悬空 else 二 义 性 而 产 
生 的 移 人 / 归 约 冲突 。 

因为 这 些 默认 规则 不 可 能 总 是 编译 器 作者 需要 的 ,所 以 Yace 提供 了 一 个 通用 的 机 制 来 解决 
移 人 / 归 约 冲突 。 在 声明 部 分 , 我 们 可 以 给 终结 符号 赋予 优先 级 和 结合 性 。 声 明 : 

fleft '+' ‘~! 


使 得 + 和 - 具有 相同 的 优先 级 , 并 且 都 是 左 结合 的 。 我 们 可 以 把 一 个 运算 符 声 明 为 右 结合 的 ， 比 如 ， 
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Yright '7' 

我 们 可 以 声明 一 个 运算 符 是 非 结合 性 的 二 目 运 算 符 ( 即 这 个 运算 符 的 两 次 出 现 不 能 合并 到 一 
起 ) ,方法 如 下 : 

ynonassoc '<' 
词法 单元 的 优先 级 是 根据 它们 在 声明 部 分 的 出 现 顺 序 而 定 的。 优先 级 最 低 的 词法 单元 最 先 
出 现 。 同 一 个 声明 中 的 词法 单元 具有 相同 的 优先 级 。 因 此 , 图 4-59 中 的 声明 

%right UMINUS ; 
赋予 词法 单元 UMINUS 的 优先 级 要 高 于 前 面 五 个 终结 符号 的 优先 级 。 

除了 给 各 个 终结 符号 赋予 优先 级 ，Yace 也 可 以 给 和 某 个 冲突 相关 的 各 个 产生 式 赋予 优先 级 
和 结合 性 , 来 解决 移入 / 归 约 冲突 。 如 果 它 必须 在 移入 一 个 输入 符号 a 和 按照 4 一 a 进行 归 约 之 
间 进 行 选择 , 那么 当 这 个 产生 式 的 优先 级 高 于 a 的 优先 级 时 , 或 者 当 两 者 的 优先 级 相同 但 产生 式 
是 左 结合 的 时 ，Yace 就 选择 归 约 ;否则 就 选择 移 人 动作 。 

通常 ,一 个 产生 式 的 优先 级 被 设 定 为 它 的 最 右 终结 符号 的 优先 级 。 在 大 多 数 情 况 下 ,这 是 一 
个 明智 的 选择 。 比 如 , 给 定 产生 式 








E+E+E\|Ex«E 

我 们 将 在 向 前 看 符号 为 + 时 按照 E->E + EE 进行 归 约 , 因为 产生 式 体 中 的 + 和 这 个 向 前 看 符 
号 具有 相同 的 优先 级 , 且 它 是 左 结合 的 。 在 向 前 看 符号 为 * 时 , 我 们 将 选择 移入 ,因为 这 个 向 前 
看 符号 的 优先 级 高 于 产生 式 体 中 + 的 优先 级 。 

在 那些 最 右 终结 符号 不 能 为 产生 式 提 供 正 确 优先 级 的 情况 下 , 我 们 可 以 在 产生 式 后 增加 一 
个 标记 

%prec (终结 符号 
来 指明 该 产生 式 的 优先 级 。 此 时 这 个 产生 式 的 优先 级 和 结合 性 将 和 这 个 终结 符号 相同 ,而 这 个 终 
结 符号 的 优先 级 和 结合 性 应 该 在 声明 部 分 定义 。Yacc 不 会 报告 那些 已 经 使 用 这 个 优先 级 /结合 ' 
机 制 解决 了 的 黎 入 / 归 约 冲突 。 

这 里 的 “终结 符号 ”可 以 仅仅 作为 一 个 占 位 符 , 就 像 图 4-59 中 的 UMINUS 那样 。 这 个 终结 符 
号 不 会 被 词法 分 析 器 返回 , 声明 它 的 目的 仅仅 是 为 了 定义 一 个 产生 式 的 优先 级 。 在 图 4-59 中 ， 
声明 

%right UMINUS 
赋予 词法 单元 UMINUS 一 个 高 于 * 和 /的 优先 级 。 在 翻译 规则 部 分 , 产生 式 

expr : '-' expr 

后 面 的 标记 

%prec UMINUS 
使 得 这 个 产生 式 中 的 单 目 减 运算 符 具 有 比 其 他 运算 符 更 高 的 优先 级 。 
4.9.3 用 Lex 创建 Yacc 的 词法 分 析 器 

Lex 的 作用 是 生成 可 以 和 Yacc 一 起 使 用 的 词法 分 析 器 。Lex 库 下 将 提供 一 个 名 为 yylex( ) 
的 驱动 程序 。Yacc 要 求 它 的 词法 分 析 器 的 名 字 为 yylex( ) 。 如 果 用 Lex 来 生成 词法 分 析 器 , A 
么 我 们 可 以 将 Yace 规约 的 第 三 部 分 的 例 程 yylex( ) 替换 为 语句 


#include "lex.yy.c" 
并 令 每 个 Lex 动作 都 返回 Yace 已 知 的 终结 符号 。 通 过 使 用 语句 #inciude "lex.yy.c", 
程序 yy lex 能 够 访问 Yace 定义 的 词法 单元 名 字 , 因为 Lex 的 输出 文件 是 作为 Yace 的 输出 文件 
Yy.tab.c 的 一 部 分 被 编译 的 。 | 
在 UNIX 系统 中 , 如 果 Lex 规约 存放 在 文件 first.1 +, H Yace 规约 在 second. y 中 ,我 
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们 可 以 使 用 命令 nunber  [0-9]+\.71 [0-9]*\ . [0-9]+ 
lex first.l hh 
yacc second.y [ ] { /* skip blanks */ } 
cc y.tab.c -ly -11 {number} { sscanf (yytext, "%lf", &yylval); 
5 return NUMBER; } 
OR At BAD SE ALPE aE o \n|. { return yytext[0]; } 
图 4-60 中 的 Lex 规约 可 以 用 在 图 4-59 te 
要 词法 分 析 器 的 地 方 。 最 后 的 表示 “任意 字符 ” 图 4-60 图 4-59 中 的 yylex 的 Lex 规约 


的 模式 必须 被 写作 n | ， 因 为 在 Lex 中 , 点 ( . ) 表示 除了 换行 符 之 外 的 任意 字符 。 
4.9.4 Yacc 中 的 错误 恢复 

Yace 的 错误 恢复 使 用 了 错误 产生 式 的 形式 。 首先, 用 户 定 义 了 哪些 “主要 ” 非 终 结 符号 fie 
EL as 通常 的 选择 是 非 终结 符号 的 某 个 子 集 , 包括 那些 用 于 生成 表达 式 、 

、 块 和 函数 的 非 终结 符号 。 然 后 ,用 户 在 文法 中 加 人 形 恕 4 一 error a 的 错误 产生 式 , 其 中 4 

Bene AAP a 是 一 个 可 能 为 空 的 文法 符号 串 ; error 是 Yace 的 一 个 保留 字 。Yacc 把 这 

人 普通 产生 式 ， ener -个 语法 分 析 器 。 

然而 ， 当 Yace 4 成 的 语法 分 析 器 碰 到 一 个 错误 时 , 它 就 以 一 种 特殊 的 方法 来 处 理 那 些 对 应 
项 集 包 含 错误 产生 式 的 状态 。 当 碰 到 一 个 错误 时 ，Yace 就 会 从 它 的 栈 中 不 断 弹出 符号 , 直到 它 
碰 到 一 个 满足 如 下 条 件 的 状态 ; 该 状态 对 应 的 项 集 包 含 一 个 形 如 A> + eror a 的 项 。 然 后 语法 
分 析 器 就 好 像 在 输入 中 看 到 了 error, 将 虚构 的 词法 单元 error HAR. 

当 a 为 e 时 , 语法 分 析 器 立刻 就 执行 一 次 归 约 到 A 的 动作 , 并 调用 和 产生 式 4 一 error 相关 
的 语义 动作 (这 可 能 是 一 个 用 户 定义 的 错误 恢复 例 程 ) 。 然 后 语法 分 析 器 抛弃 一 些 输入 符号 , A 
到 它 找到 某 个 使 它 可 以 继续 进行 正常 的 语法 分 析 的 符号 为 止 。 

如 果 a AAS , Yace 将 向 前 跳 过 一 些 输入 符号 , 寻找 可 以 被 归 约 为 a WFR, WR EA 
由 终结 符号 组 成 , 那么 它 就 在 输入 中 寻找 这 个 终结 符号 串 , 并 将 它们 移入 到 栈 中 进行 “ 归 约 ”。 
此 时 , 语法 分 析 器 栈 的 顶部 是 error a。 然 后 语法 分 析 器 将 把 error a 归 约 为 4, 并 继续 进行 正常 
的 语法 分 析 。 

比如 , 一 个 形 如 

stmi— error ; 

nei a. FIL Or ae te Me Bl — TP BR REE FTA, 并 假装 已 经 找到 

一 个 语句 。 这 个 错误 产生 式 的 语义 例 程 不 需要 处 理 输 入 , 而 是 可 以 直接 生成 诊断 消息 并 做 出 
Lenn, 比如 设置 一 个 标志 来 禁止 生成 目标 代码 。 


图 4- 61 在 图 4-59 所 示 的 Yace 桌 上 计算 器 中 增加 了 错误 产生 式 

lines : error '\n' 

这 个 错误 产生 式 使 得 这 个 桌 上 计算 器 在 输入 中 发 现 一 个 语法 错误 时 停止 正常 的 语法 分 析 工 
作 。 当 碰 到 错误 时 , 桌 上 计算 器 的 语法 分 析 器 开始 从 它 的 栈 中 弹出 符号 , 直到 它 在 栈 中 发 现 一 个 
在 输入 为 error 时 执行 移 人 动作 的 状态 。 状 态 0 就 是 这 样 的 一 .个 状态 (在 这 个 例子 里 面 ， 它 是 唯 

一 个 这 样 的 状态 , 因为 它 的 项 包括 了 
lines—> error ‘\n' 

同时 ， sire 总 是 在 栈 的 底部 。 语 法 分 析 器 将 词法 单元 error BARS, 然后 向 前 跳 过 输入 
符号 , 直到 它 发 现 一 个 换行 符 为 止 。 此 时 , 语法 分 析 器 将 换行 符 移 人 到 栈 中 , 将 error'n' 归 约 
为 lines ,并 发 出 诊 cae ‘请 重新 输入 前 一 行 ”。 专 门 的 Yace 例 程 yyerrok 将 语法 分 析 器 的 状 
态 重新 设置 为 正当 操作 模式 。 口 
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7{ 

#include <ctype.h> 

#include <stdio.h> 

#define YYSTYPE double /* double type for Yacc stack */ 
VA; 

Atoken NUMBER 


left ‘+' '-' 
“left ‘*' '/' 
“right UMINUS 
hh 
lines : lines expr '\n' { printf("%g\n", $2); } 
| lines '\n' 
- | /* empty */ 
| error '\n' { yyerror("reenter previous line:"); 
yyerrok; } 
expr : expr '+' expr { $$ = $1 + $3; } 
| expr '-' expr { $$ = $1 - $3; } 
| expr '*' expr { $$ = $1 * $3; } 
| expr '/' expr { $$ = $1 / $3; } 
| C expr ')' { $$ = $2; } 
| "-' expr %prec UMINUS { $$ = - $2; } 
| NUMBER 


hh 
#include "lex.yy.c" 








图 4-61 带 有 错误 恢复 的 桌面 计算 器 

4.9.5 4.9 节 的 练习 

! 练习 4. 9.1: 编写 一 个 Yace 程序 。 它 以 布尔 表达 式 ( 如 练习 4. 2.2(7) 中 的 文法 所 描述 的 ) 
作为 输入 , 并 计算 出 这 个 表达 式 的 值 。 

| 练习 4. 9. 2: 编写 一 个 Yace 程序 。 它 以 列表 (如 练习 4. 2.2(5) 中 的 文法 所 定义 的 , 但 是 其 
元 素 可 以 是 任意 的 单个 字符 ,而 不 仅仅 是 a) 作为 输入 , 并 输出 这 个 列表 的 线性 表示 , 即 这 些 元 素 
的 单一 列表 ,并且 元 素 顺序 和 它们 在 输入 中 的 顺序 相同 。 

| 练习 4. 9. 3: 编写 一 个 Yacc 程序 。 它 的 功能 是 说 明 输 入 是 否 一 个 回 文 ( 即 向 前 和 向 后 读 都 
一 样 的 字符 序列 ) 。 

1! 练习 4. 9.4: 编写 一 个 Yace 程序 。 它 以 正则 表达 式 ( 如 练习 4.2.2(4) 中 文法 的 定义 的 ， 
但 是 参数 可 以 是 任意 字符 , 而 不 仅仅 是 a) 作为 输入 , 并 输出 一 个 能 够 识别 相同 语言 的 不 确定 有 
穷 自动 机 的 转换 表 。 


4.10 第 4 章 总 结 


o 语法 分 析 器 。 语 法 分 析 器 的 输入 是 来 自 词法 分 析 器 的 词法 单元 序列 。 它 将 词法 单元 的 名 
字 作 为 一 个 上 下 文 无 关 文法 的 终结 符号 。 然 后 ,语法 分 析 器 为 它 的 词法 单元 输入 序列 构造 
出 一 棵 语法 分 析 树 。 可 以 象征 性 地 构造 这 棵 语法 分 析 树 ( 即 仅仅 遍历 相应 的 推导 步骤 ) ， 
也 可 以 显 式 生成 分 析 树 。 

o 上 下 文 无 关 文法 。 一 个 文法 描述 了 一 个 终结 符号 集合 (输入 ), 男 一 个 非 终 结 符号 集合 (表示 
语法 构造 的 符号 ) 和 一 组 产生 式 。 每 个 产生 式 说 明了 如 何 从 一 些 部 件 构造 出 某 个 非 终 结 符号 
所 代表 的 符号 串 。 这 些 部 件 可 以 是 终结 符号 , 也 可 以 是 另外 一 些 非 终结 符号 所 代表 的 串 。 一 
个 产生 式 由 头 部 (将 被 蔡 换 的 非 终结 符号 ) 和 产生 式 体 ( 用 来 替换 的 文法 符号 串 ) 组 成 。 
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o 推导 。 从 文法 的 开始 非 终结 符号 出 发 , 不 断 将 某 个 非 终结 符号 替换 为 它 的 某 个 产生 式 体 的 过 程 
称 为 推导 。 如 果 总 是 替换 最 左 ( 最 右 ) 的 非 终结 符号 , 那么 这 个 推导 就 称 为 最 左 推导 (最 右 推 导 ) 。 
© 语法 分 析 树 。 一 标语 法 分 析 树 是 一 个 推导 的 图 形 表示 。 在 推导 中 出 现 的 每 一 个 非 终结 符号 都 在 
树 中 有 一 个 对 应 结 点 。 一 个 结 点 的 子 结 点 就 是 在 推导 中 用 来 蔡 换 该 结 点 对 应 的 非 终 结 符号 的 文 
法 符号 串 。 在 同一 终结 符号 串 的 语法 分 析 树 、 最 左 推导 、 最 右 推导 之 间 存 在 一 一 对 应 关系 。 

o 二 义 性 。 如 果 一 个 文法 的 某 些 终结 符号 串 有 两 棵 或 多 棵 语法 分 析 树 ， 或 者 等 价 地 说 有 两 个 
或 多 个 最 左 推导 /最 右 推导 , 那么 这 个 文法 就 称 为 二 义 人 性 文法 。 在 实践 中 的 大 多 数 情况 下 ， 
我 们 可 以 对 一 个 二 义 性 文法 进行 重新 设计 , 使 它 变 成 一 个 描述 相同 语言 的 无 二 义 性 文法 。 

然而 , 有 时 使 用 二 义 性 文法 并 应 用 一 些 技巧 可 以 得 到 更 加 高 效 的 语法 分 析 器 。 

自 顶 向 下 和 自 底 向 上 语法 分 析 。 语 法 分 析 器 通常 可 以 按照 它们 的 工作 方式 分 为 自 顶 向 下 的 
(从 文法 的 开始 符号 出 发 ,从 顶部 开始 构造 语法 分 析 树 ) 和 自 底 向 上 的 (从 构成 语法 分 析 树 叶 
子 结 点 的 终结 符号 串 开始 ,从 底部 开始 构造 语法 分 析 树 ) 。 自 顶 向 下 的 语法 分 析 器 包括 递归 
下 降 语 法 分 析 器 和 LL 语法 分 析 器 , 而 最 常见 的 自 底 向 上 语法 分 析 器 是 LR 语法 分 析 器 。 
文法 的 设计 。 和 自 底 向 上 语法 分 析 器 使 用 的 文法 相 比 , 适合 进行 自 顶 向 下 语法 分 析 的 文法 





通常 较 难 设计 。 我 们 必须 要 消除 文法 的 左 递 归 , 即 一 个 非 终结 符号 推导 出 以 这 个 非 终结 符 . 


号 开头 的 符号 串 的 情况 。 我 们 还 必须 提取 左 公 因子 一 也 就 是 对 同一 个 非 终结 符号 的 有 具 
有 相同 的 产生 式 体 前 缀 的 多 个 产生 式 进行 分 组 。 

递归 下 降 语法 分 析 器 。 这 些 分 析 器 对 每 个 非 终结 符号 使 用 一 个 过 程 。 这 个 过 程 查看 它 的 
输入 并 确定 应 该 对 它 的 非 终结 符号 应 用 哪个 产生 式 。 相 应 产生 式 体 中 的 终结 符号 在 适当 
的 时 候 和 输入 中 的 符号 进行 匹配 , 而 产生 式 体 中 的 非 终 结 符号 则 引发 对 它们 的 过 程 的 调 
用 。 当 选择 了 错误 的 产生 式 时 ,有 可 能 需要 进行 回溯 。 

LL(1) 语 法 分 析 器 。 对 于 一 个 文法 , 如 果 只 需要 查看 下 一 个 输入 符号 就 可 以 选择 正确 的 产生 式 
来 扩展 一 个 给 定 的 非 终 结 符号 , 那么 这 个 文法 就 称 为 是 LL(1) 的 。 这 类 文法 允许 我 们 构造 出 一 
个 预测 语法 分 析 表 。 对 于 每 个 非 终结 符号 和 每 个 向 前 看 符号 , 这 个 表 指 明了 应 该 选择 哪个 产生 
式 。 在 某 些 或 所 有 没有 合法 产生 式 的 空 条 目 中 放置 错误 处 理 例 程 有 助 于 实现 错误 恢复 。 
BA- 归 约 语法 分 析 技 术 。 自 底 向 上 语法 分 析 器 一 般 按 照 如 下 方式 运行 : 根据 下 一 个 输入 
符号 (向 前 看 符号 ) 和 栈 中 的 内 容 , 选择 是 将 下 一 个 输入 移 人 栈 中 , 还 是 将 栈 顶 部 的 某 些 符 
号 进行 归 约 。 归 约 步骤 将 栈 顶 部 的 一 个 产生 式 体 蔡 换 为 这 个 产生 式 的 头 。 

TIHA. EBA - 归 约 语法 分 析 过 程 中 , 栈 中 的 内 容 总 是 一 个 可 行 前 缀 一 一 也 就 是 某 个 
最 右 句 型 的 前 缀 , 且 这 个 前 缀 的 结尾 不 会 比 这 个 名 型 的 句柄 的 结尾 更 靠 右 。 句 柄 是 在 这 个 
句 型 的 最 右 推 导 过 程 中 在 最 后 一 步 加 入 此 名 型 中 的 子 串 。 

© 有 效 项 。 在 一 个 产生 式 的 体 中 某 处 加 上 一 个 点 就 得 到 一 个 项 。 一 个 项 对 某 个 可 行 前 缀 有 
效 的 条 件 是 该 项 的 产生 式 被 用 来 生成 该 可 行 前 缀 对 应 的 句 型 的 句柄 ,， 且 这 个 可 行 前 级 中 
包括 项 中 位 于 点 左边 的 所 有 符号 , 但 是 不 包含 点 右边 的 任何 符号 。 

LR 语法 分 析 器 。 每 一 种 LR 语法 分 析 器 都 首先 构造 出 各 个 可 行 前 级 的 有 效 项 的 项 集 ( 称 为 
LR 状态 ), 并 且 在 栈 中 跟踪 每 个 可 行 前 缀 的 状态 。 有 效 项 集合 引导 语法 分 析 器 做 出 移 
入 一 归 约 决定 。 如 果 项 集中 某 个 有 效 项 的 点 在 产生 式 体 的 最 右 端 , 那么 我 们 就 进行 归 约 ; 
如 果 下 一 个 输入 符号 出 现在 某 个 有 效 项 的 点 的 右边 , 我 们 就 会 把 向 前 看 符号 移 人 栈 中 。 
简单 LR 语法 分 析 器 。 在 一 个 SLR 语法 分 析 器 中 , 我 们 按照 某 个 点 在 最 右 端 的 有 效 项 进行 
归 约 的 条 件 是 : 向 前 看 符号 能 够 在 某 个 名 型 中 跟 在 该 有 效 项 对 应 的 产生 式 的 头 符号 的 后 
面 。 如 果 没 有 请 法 分 析 动 作 冲 突 , 那么 这 个 文法 就 是 SLR 的 , 就 可 以 应 用 这 个 方法 。 所 谓 
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没有 语法 分 析 动 作 冲 突 ， 就 是 说 对 于 任意 项 集 和 任意 向 前 看 符号 , 都 不 存在 两 个 要 归 约 的 
产生 式 , 也 不 会 同时 存在 归 约 或 移入 的 可 选 动作 。 

规范 LR 语法 分 析 器 。 这 是 一 种 更 复杂 的 LR 语法 分 析 器 。 它 使 用 的 项 中 增加 了 一 个 向 前 
看 符号 集合 。 当 应 用 这 个 产生 式 进行 归 约 时 , 下 一 个 输入 符号 必须 在 这 个 集合 中 。 只 有 当 
存在 一 个 点 在 最 右 端的 有 效 项 , 并 且 当 前 的 向 前 看 符号 是 这 个 项 允许 的 向 前 看 符号 之 一 
时 , 我 们 才 可 以 决定 按照 这 个 项 的 产生 式 进行 归 约 。 一 个 规范 LR 语法 分 析 器 可 以 避免 某 
些 在 SLR 语法 分 析 器 中 出 现 的 分 析 动 作 冲 突 , 但 是 它 的 状态 常常 会 比 同一 个 文法 的 SLR 
语法 分 析 器 的 状态 更 多 。 

向 前 看 LR 语法 分 析 器 。LALR 语法 分 析 器 同时 具有 SLR 语法 分 析 器 和 规范 LR 语法 分 析 
器 的 很 多 优点 。 它 将 具有 相同 核心 (忽略 了 相关 向 前 看 符号 集合 之 后 的 项 的 集合 ) 的 状态 
合并 到 一 起 。 因 此 , 它 的 状态 数量 和 SLR 语法 分 析 器 的 状态 数量 相同 , 但 是 在 SLR 语法 分 
析 器 中 出 现 的 某 些 语法 分 析 动 作 冲 突 不 会 出 现在 LALR 语法 分 析 器 中 。LALR 语法 分 析 器 
是 实践 中 经 常 选择 的 方法 。 : 
二 义 性 文法 的 自 底 向 上 语法 分 析 。 在 很 多 重要 的 场合 下 , 比如 对 算术 表达 式 进行 语法 分 析 
时 ,我 们 可 以 使 用 二 义 性 文法 , 并 利用 一 些 附 加 的 信息 ， 比 如 运算 符 的 优先 级 , 来 解决 移 
入 和 归 约 之 间 的 冲突 , 或 者 两 个 不 同 产 生 式 之 间 的 归 约 冲突 。 这 样 ，LR 语法 分 析 技 术 就 
被 扩展 应 用 于 很 多 二 义 性 文法 中 。 

e Yacc。 语 法 分 析 器 生成 工具 Yacc 以 一 个 (可 能 的 ) 二 义 性 文法 以 及 冲突 解决 信息 作为 输 
A, 构造 出 LALR 状态 集合 。 然 后 , 它 生 成 一 个 使 用 这 些 状态 来 进行 自 底 向 上 语法 分 析 的 
函数 。 该 函数 在 执行 每 一 个 归 约 动作 时 都 会 调用 和 相应 产生 式 关联 的 函数 。 
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OS 语法 制导 的 翻译 


本 章 继续 2. 3 节 的 主题 : 使 用 上 下 文 无 关 文法 来 引导 对 语言 的 翻译 。 本 章 讨论 的 翻译 技术 将 
在 第 6 章 中 用 于 类 型 检查 和 中 间 代 码 生 成 。 这 些 技术 也 可 以 用 于 实现 那些 完成 特殊 任务 的 小 型 
语言 。 本 章 包含 了 一 个 有 关 排 版 的 例子 。 

如 2.3.2 节 所 讨论 的 , 我 们 把 一 些 属 性 附加 到 代表 语言 构造 的 文法 符号 上 ， 从 而 把 信息 和 一 
个 语言 构造 联系 起 来 。 语 法 制导 定义 通过 与 文法 产生 式 相关 的 语义 规则 来 描述 属性 的 值 。 比 如 ， 
一 个 从 中 缀 表达 式 到 后 级 表达 式 的 翻译 器 可 能 包含 如 下 产生 式 和 规则 : 





产生 式 语义 规则 
EAE +T E.code = E, .code || T.code || ‘+! (5.1) 


这 个 产生 式 有 两 个 非 终结 符号 五 和 了 , Ei 的 下 标 用 于 区 分 5 在 产生 式 体 中 的 出 现 和 在 产 
生 式 头 部 的 出 现 。E 和 了 都 有 一 个 字符 串 类 型 的 属性 code。 上 面 的 语义 规则 指明 字符 串 E. code 
是 通过 将 Bi. code, T. code 和 字符 + 连接 起 来 而 得 到 的 。 虽 然 这 个 规则 明确 指出 对 互 的 翻译 结果 
是 根据 、7 的 翻译 结果 和 “+ "构造 得 到 的 , 但 直接 通过 字符 串 操 作 来 实现 这 个 翻译 过 程 是 很 
低 效 的 。 l 
根据 2. 3. 5 节 的 介绍 可 知 , E SY ED REPERE RRA TRIE BITE RE Y 
段 。 比 如 

E~+F,+T { print '+' } (5.2) 

按照 惯例 , 语义 动作 放 在 花 括 号 之 内 。( 对 于 作为 文法 符号 出 现 的 花 括号 , 我 们 将 用 单 引 号 
把 它们 括 起 来 , 比如 “ {和 “1 。) 一 个 语义 动作 在 产生 式 体 中 的 位 置 决 定 了 这 个 动作 的 执行 顺 
序 。 在 产生 式 (5. 2) 中 , 语义 动作 出 现在 所 有 文法 符号 之 后 。 一 般 情况 下 , 语义 动作 可 以 出 现在 
产生 式 体 中 的 任何 位 置 。 

对 于 这 两 种 标记 方法 , 语法 制导 定义 更 加 易 读 ,因此 更 适合 作为 对 翻译 的 规约 。 而 翻译 方案 
更 加 高 效 , 因此 更 适合 用 于 翻译 的 实现 。 

最 通用 的 完成 语法 制导 翻译 的 方法 是 先 构 造 一 棵 语法 分 析 树 , 然后 通过 访问 这 棵 树 的 各 个 
结 点 来 计算 结 点 的 属性 值 。 在 很 多 情况 下 ,翻译 可 以 在 扫描 分 析 过 程 中 完成 , 不 需要 构造 出 明确 . 
的 语法 分 析 树 。 因 此 , 我 们 将 研究 一 类 称 为 “LL 属性 翻译 ”(L 代表 从 左 到 右 ) 的 语法 制导 翻译 方 
R, 这 一 类 方案 实际 上 包含 了 所 有 可 以 在 语法 分 析 过 程 中 完成 的 翻译 方案 。 我 们 还 将 研究 一 个 
较 小 的 类 别 , 称 为 “S 属性 翻译 方案 ”(S 代表 综合 ) , 这 类 方案 可 以 很 容易 地 和 自 底 向 上 语法 分 析 
过 程 联系 起 来 。 


5. 1 语法 制导 定义 


语法 制导 定义 (Syntax-Directed Definition,SDD) 是 一 个 上 下 文 无 关 文 法 和 属性 及 规则 的 结合 。. 
属性 和 文法 符号 相关 联 , 而 规则 和 产生 式 相 关联 。 如 果 半 是 一 个 符号 而 a 是 了 的 一 个 属性 , 那么 ; 
RMA X. a 来 表示 a 在 某 个 标号 为 X 的 分 析 树 结 点 上 的 值 。 如 果 我 们 使 用 记录 或 对 象 来 实现 这 
个 语法 分 析 树 的 结 点 , 那么 X 的 属性 可 以 被 实现 为 代表 的 结 点 的 记录 的 数据 字段 。 属 性 可 以 
有 多 种 类 型 ， 比 如 数字 、 类 型 、 表 格 引用 或 串 。 这 些 串 甚至 可 能 是 很 长 的 代码 序列 ， 比 如 编译 器 
使 用 的 中 间 语 言 的 代码 。 








语法 制 时 的 翻译 





6.1.1 继承 属性 和 综合 属性 

我 们 将 处 理 非 终结 符号 的 两 种 属性 : 

1) 综合 属性 (synthesized attribute); 在 分 析 树 结 点 上 的 非 终 结 符号 4 的 综合 属性 是 由 NN 上 
的 产生 式 所 关联 的 语义 规则 来 定义 的 。 请 注意 , 这 个 产生 式 的 头 一 定 是 4。 结 点 N 上 的 综合 属性 
只 能 通过 NN 的 子 结 点 或 本身 的 属性 值 来 定义 。 

2) 继承 属性 (inherited attribute) : 在 分 析 树 结 点 N 上 的 非 终 结 符号 B 的 继承 属性 是 由 NN 的 父 
结 点 上 的 产生 式 所 关联 的 语义 规则 来 定义 的 。 请 注意 ,这 个 产生 式 的 体 中 必然 包含 符号 Be HA 
N 上 的 继承 属性 只 能 通过 NN 的 父 结 点 、N 本身 和 的 兄弟 结 点 上 的 属性 值 来 定义 。 








另 一 种 定义 继承 属性 的 方法 i 
l 即使 我 们 允许 结 点 N 上 的 一 个 继承 属性 B. c 通过 N 的 子 结 点 、N 本 身 、N 的 父 结 点 和 兄 
弟 结 点 上 的 属性 值 来 定义 , 我 们 可 以 定义 的 翻译 的 种 类 并 不 会 增加 。 这 样 的 规则 可 以 通过 创 
建 附加 的 B 的 属性 ， 比如 B. cl 、8. cx、… 来 模拟 。 这 些 都 是 综合 属性 , 用 于 把 标号 为 8 的 结 
点 的 子 结 点 上 的 属性 拷贝 过 来 。 然 后 , 我 们 使 用 属性 8. cl B. c，、… 来 蔡 换 子 结 点 属性 , 按照 
继承 属性 的 方法 计算 得 到 B. c。 在 实践 中 很 少 需要 这 种 属性 。 














我 们 不 允许 结 点 N 上 的 继承 属性 通过 的 子 结 点 上 的 属性 值 来 定义 , 但 是 我 们 允许 结 点 N 
上 的 一 个 综合 属性 通过 结 点 N 本 身 的 继承 属性 来 定义 。 
”终结 符号 可 以 具有 综合 属性 , 但 是 不 能 有 继承 属性 。 终 结 符号 的 属性 值 是 由 词法 分 析 器 提 
供 的 词法 值 , 在 SDD 中 没有 计算 终结 符号 的 属性 值 的 语义 规则 。 
FG 5-1 中 的 SDD 基于 我 们 熟悉 的 带 有 运算 符 * 和 + 的 算术 表达 式 文法 。 它 对 一 个 以 n 作为 
结尾 标记 的 表达 式 求 值 。 在 这 个 SDD 中 , 每 个 非 终结 符号 具有 唯一 的 被 称 为 val 的 综合 属性 。 我 们 同 
时 假设 终结 符号 digit 具有 一 个 综合 属性 lexval, 它 是 由 词法 分 析 器 返回 的 整数 值 。 g 
产生 式 1 LE n WRUH L. val 设置 为 Eval。 























我 们 将 看 到 ， 它 就 是 整个 表达 式 的 值 。 a 
产生 式 2 ESE, + 了 也 有 一 个 规则 。 它 计算 出 Et | 2) Boe, +T | Eva= E .val+ Tva 

和 了 的 值 的 和 , 作为 产生 式 头 五 的 val 属性 的 值 。 在 |39 EOT Eval = T.val 

任何 标号 为 的 语法 分 析 树 结 点 NN 上 , 的 vol 什 是 | OOTP | Boole pa Poa 

太 的 两 个 子 结 点 (标号 分 别 为 EE 和 T) 上 的 val 值 6) F3(E) Pgh 

的 和 。 7) F> digit F.val = digit.lexval 














产生 式 3 ET 有 了 唯一 的 规则 , CELT EW val = 
值 和 对 应 于 7 的 子 结 点 的 val 值 相 同 。 产 生 式 4 和 第 图 5-1 一 个 简单 的 桌 上 计算 器 


二 个 产生 式 类 似 , 它 的 规则 将 子 结 点 的 值 相 乘 ， 而 不 的 请 法 制导 定义 
EHM. PERS 和 6 的 规则 和 第 三 个 产生 式 的 规则 类 似 , 它们 拷贝 子 结 点 的 值 。 产 生 式 7 给 
F. val 赋予 一 个 digit 的 值 ， 即 由 词法 分 析 器 返回 的 词法 单元 digit 的 数值 。 口 


一 个 只 包含 综合 属性 的 SDD 称 为 $ 属性 (S-attribute) 的 SDD, 图 5-1 中 的 SDD 就 具有 这 个 性 
质 。 在 一 个 S 属性 的 SDD F, 每 个 规则 都 根据 相应 产生 式 的 产生 式 体 中 的 属性 值 来 计算 产生 式 
头 部 非 终 结 符号 的 一 个 属性 。 

为 简单 起 见 , 本 节 中 的 语义 规则 没有 副作用 。 在 实践 中 , 允许 SDD 具有 一 些 副作用 会 带 来 
一 些 方便 。 比 如 允许 打印 桌 上 计算 器 计算 得 到 的 结果 , 或 者 和 一 个 符号 表 进 行 交 互 。 等 到 在 5.2 
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节 中 讨论 了 属性 的 求 值 顺序 之 后 , 我 们 将 允许 语义 规则 计算 任意 的 函数 ， 这 些 函 数 可 能 会 有 副 
作用 。 

一 个 S$ 属 性 的 SDD 可 以 和 一 个 LR 语法 分 析 器 一 起 自然 地 实现 。 实 际 上 , 图 5-1 中 的 SDD 是 
图 4-58 中 的 Yace 程序 的 男 一 种 表示 , 该 程序 演示 了 在 LR 语法 分 析 过 程 中 进行 翻译 的 过 程 。 两 
者 的 区 别 在 于 ，Yacc 程序 在 产生 式 1 的 规则 中 通过 副作用 打印 了 E. val 的 值 , 而 不 是 定义 属 
ML. valo 

一 个 没有 副作用 的 SDD 有 时 也 称 为 属性 文法 (attribute grammar) 。 一 个 属性 文法 的 规则 仅仅 
通过 其 他 属性 值 和 常量 值 来 定义 一 个 属性 值 。 

5.1.2 在 语法 分 析 树 的 结 点 上 对 SDD KE 

在 语法 分 析 树 上 进行 求 值 有 助 于 将 SDD 所 描述 的 翻译 方案 可 视 化 ,虽然 翻译 器 实际 上 不 需 
要 构建 语法 分 析 树 。 因 此 , 我 们 想象 一 下 在 应 用 一 个 SDD 的 规则 之 前 首先 构造 出 一 棵 语法 分 析 
树 , 然后 再 使 用 这 些 规 则 对 这 棵 语法 分 析 树 上 的 各 个 结 点 上 的 所 有 属性 进行 求 值 。 一 个 显示 了 
它 的 各 个 属性 的 值 的 语法 分 析 树 称 为 注释 语法 分 析 树 (annotated parse tree) 。 

我 们 如 何 构造 一 棵 注释 语法 分 析 树 呢 ? 我 们 按照 什么 顺序 来 计算 各 个 属性 ? 在 我 们 对 一 棵 
语法 分 析 树 的 某 个 结 点 的 一 个 属性 进行 求 值 之 前 ,必须 首先 求 出 这 个 属性 值 所 依赖 的 所 有 属性 
值 。 比 如 ,如 例 5.1 所 示 , 所 有 的 属性 都 是 综合 属性 , 那么 在 我 们 对 一 个 结 点 上 的 val 属性 求 值 
之 前 , 必须 求 出 该 结 点 的 所 有 子 结 点 的 属性 val 的 值 。 

对 于 综合 属性 , 我 们 可 以 按照 任何 自 底 向 上 的 顺序 计算 它们 的 值 ， 比 如 对 语法 分 析 树 进行 后 
序 遍 历 的 顺序 。 对 于 S 属性 定义 的 求 值 将 在 5.2.3 节 中 讨论 。 

对 于 同时 具有 继承 属性 和 综合 属性 的 SDD, 不 能 保证 有 一 个 顺序 来 对 各 结 点 上 的 属性 进行 
求 值 。 比 如 , 考虑 非 终结 符号 4 和 8, 它们 分 别 具 有 综合 属性 4.s 和 继承 属性 B. i。 同 时 它们 的 
产生 式 和 规则 如 下 : 


产生 式 语义 规则 
A~B A.s = Bui; 
Bi=Ast+1 


这 些 规则 是 循环 定义 的 。 不 可 能 首先 求 出 结 点 N 上 的 A. s 或 N 的 子 结 点 ; 
上 的 B.i 中 的 一 个 的 值 , 然后 再 求 出 另 一 个 的 值 。 一 棵 语法 分 析 树 的 某 个 结 点 
对 上 的 4.s 和 B.i 之 间 的 循环 依赖 关系 如 图 5-2 所 示 。 

从 计算 的 角度 看 , 给 定 一 个 SDD, 很 难 确定 是 否 存 在 某 棵 语法 分 析 树 使 得 ( ) 
SDD 的 属性 值 之 间 具 有 循环 依赖 关系 8。 幸 运 的 是 , 存在 一 个 SDD 的 有 用 子 a 
类 , 它们 能 够 保证 对 每 棵 语法 分 析 树 都 存在 一 个 求 值 顺序 。 我 们 将 在 5. 2 节 中 
介绍 这 类 SDD。 
URA 图 53 显示 了 一 个 对 应 于 输入 串 3 *5 +4n 的 注释 语法 分 析 树 , 该 图 52 4s MB! 
分 析 树 是 利用 图 5-1 的 文法 和 规则 构造 得 到 的 。 我 们 假定 leal 的 值 由 词法 分 之 间 的 循环 依赖 
析 器 提供 。 对 应 于 非 终结 符号 的 每 个 结 点 都 有 一 个 按 自 底 向 上 顺序 计算 得 到 的 val 属性 。 在 图 中 
.我们 可 以 看 到 每 个 结 点 都 关联 了 一 个 结果 值 。 比 如 , 在 图 中 结 点 * 的 父 结 点 上 ， 当 计算 得 到 它 的 
第 一 和 第 三 个 子 结 点 上 的 7.val =3 和 F.val =5 之 后 , 我 们 应 用 了 相应 的 规则 , 指明 T. val 就 是 这 





O 简单 地 讲 , 虽 然 这 个 问题 是 可 判定 的 ,但 即使 PP MSL, 它 也 不 可 能 使 用 多 项 式 时 间 的 算法 来 求解 ， 因 为 它 具 7 
有 指数 的 时 间 复杂 性 。 | 
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两 个 值 的 乘积 , 即 15。 

当 一 棵 语法 分 析 树 的 结构 和 源 代码 的 抽象 语法 不 "匹配 时， 继承 属性 是 很 有 用 的 。 因 为 文 
法 不 是 为 了 翻译 而 定义 的 ,而 是 以 语法 分 析 为 目的 进行 定义 的 ， 因 此 可 能 会 产生 这 种 不 匹配 的 情 
况 。 下 面 的 例子 显示 了 如 何 使 用 继承 属性 来 解决 这 个 问题 。 








L.val = 19 
| 
Eval = 19 n 
| 
E.val = 15 + T.val=4 
| 
T.val = 15 ; mak 
T.val = 3 * F.val=5 digit.lecval = 4 
| 
F.val=3 sales =p 


digit lezval = 3 
图 5-3 3 *5+4n 的 注释 语法 分 析 树 


图 5-4 中 的 SDD 计算 诸如 3 *5 和 3 *5*7 这 样 的 项 。 处 理 输入 3 *5 的 自 顶 向 下 语法 
分 析 过 程 首先 使 用 了 产生 式 TFT, RE, FERTIL, 但 是 运算 符 * 由 TER A, £ 
运算 分 量 3 和 运算 符 * 位 于 不 同 的 子 树 中。 我 们 将 使 用 一 个 继承 属性 来 把 这 个 运算 分 量 传递 给 
这 个 例子 中 的 文法 摘自 常见 的 表达 式 文法 的 无 左 递归 版 本 , 我 们 在 4. 4 节 中 使 用 这 个 文法 作 
为 说 明 自 顶 向 下 语法 分 析 的 例子 。 
非 终结 符号 了 和 下 各 自 有 一 个 综合 属性 val, RE 



































产生 式 语义 规则 

结 符号 digit 有 一 个 综合 属性 lexval。 非 终结 符号 T' 具 = 

a 1) T>FT T' inh = F.val 
有 两 个 属性 : 继承 属性 inh 和 综合 属性 syn。 

这 些 语 义 规 则 基于 如 下 思想 运算 符 * 的 左 运算 2) TFT! T! inh = T'.inh x F.val 
分 量 是 通过 继承 得 到 的 。 更 准确 地 说 , 产生 式 了 一 T' syn = Tj.syn 
x TFBS TART PEAS * 的 左 运算 分 量 。 给 3) T>e T'.syn = T' inh 
定 一 个 项 %* y*z, 对 应 于 *y*z 的 子 树 的 根 结 点 继 4) F - digit | F.val = digit.lesval 
; k 的 根 结 点 继 yky 

ak onen ih ee 图 5-4 一 个 基于 适用 于 自 顶 向 
的 值 。 如 果 项 中 还 有 更 多 的 因子 , 我 们 可 以 继续 这 样 下 语法 分 析 的 文法 的 SDD 


的 处 理 过 程 。 当 所 有 的 因子 都 处 理 完毕 后 , 这 个 结果 
就 通过 综合 属性 向 上 传递 到 树 的 根部 。 

为 了 了 解 如 何 使 用 这 些 语 义 规则 , 考虑 图 5-5 中 对 应 于 3 * 5 的 注释 语法 分 析 树 。 这 棵 语法 
分 析 树 中 最 左边 的 标号 为 digit 的 叶子 结 点 具有 属性 值 lexval =3, 其 中 的 3 是 由 词法 分 析 器 提供 
的 。 它 的 父 结 点 对 应 于 产生 式 4， 即 大-*dig 直 。 和 这 个 产生 式 相关 的 唯一 语义 规则 定义 天 val = 
digit. lexval, 等 于 3。 
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在 根 结 点 的 第 二 个 子 结 点 上 , 继承 属性 7. inh 根 据 和 产生 式 1 关联 的 语义 规则 T' inh =F. val 定义 。 
因此 , 运算 符 * 的 左 运算 分 量 3 从 根 结 点 的 左 子 结 点 传递 到 右 子 结 点 。 








对 应 于 的 结 点 的 产生 式 是 T'— * FT1。 ` T.val=15 

(我 们 保留 了 注释 语法 分 析 树 中 的 下 标 1， 以 

区 分 树 中 的 两 个 到 结 点 。) 继 承 属性 Ti 是 Fa Tih = 3 

由 语义 规则 Th ink = 7". inh x F. val 定义 的 ， oe 

这 个 规则 和 产生 式 2 相关 联 。 digit.lezval = 3 S00 ihe’ 
已 知 7'.inh=3 且 Fval =5, 我 们 得 到 2 

Tj. inh = 15。 在 层次 较 低 的 7 结 点 上 的 产生 Sa | 

AB Te, MATAR AU T. syn = T. inh 

定义 了 Ti. syn =15。 各 个 TE LAY HE syn APE OU ROE E 

将 值 15 沿 着 树 向 上 传递 到 了 结 点 , 使 得 7.val = 15, E 


5.1.3 5..1 节 的 练习 
练习 5. 1.1: 对 于 图 5-1 中 的 SDD, 给 出 下 列表 达 式 对 应 的 注释 语法 分 析 树 : 
1) (3+4) * (5+6)n ; 
2) 1*2*3#*(4+5)n 
3) (9+8 * (746) +5) *4n 
”练习 5.1.2: 扩展 图 5-4 中 的 SDD, 使 它 可 以 像 图 5-1 所 示 的 那样 处 理 表达 式 。 
练习 5. 1.3: 使 用 你 在 练习 5. 1. 2 中 得 到 的 SDD, 重复 练习 5.1.1。 


5.2 SDD 的 求 值 顺 序 


依赖 图 ( dependency graph) 是 一 个 有 用 的 工具 , 它 可 以 确定 一 棵 给 定 的 语法 分 析 树 中 各 个 属 
性 实例 的 求 值 顺序 。 注 释 语 法 分 析 树 显示 了 各 个 属性 的 值 ， 而 依赖 图 可 以 帮助 我 们 确定 如 何 计 
算 这 些 值 。 

在 本 节 中 , 除了 依赖 图 , 我 们 还 定义 了 两 类 重要 的 SDD:“S 属性 "SDD 和 更 加 通用 的 “L 属性 ” 
SDD。 使 用 这 两 类 SDD 措 述 的 翻译 方案 可 以 和 我 们 已 经 研究 过 的 语法 分 析 方法 很 好 地 结合 在 一 起 。 并 
且 在 实践 中 遇 到 的 大 部 分 翻译 方案 可 以 按照 这 两 类 SDD 中 的 至 少 一 类 的 要 求 写 出 来 。 

5.2.1 依赖 图 

依赖 图 描述 了 某 个 语法 分 析 树 中 的 属性 实例 之 间 的 信息 流 。 从 一 个 属性 实例 到 另 一 个 实例 
的 边 表示 计算 第 二 个 属性 实例 时 需要 第 一 个 属性 实例 的 值 。 图 中 的 边 表示 语义 规则 所 蕴涵 的 约 
束 。 更 详细 地 说 : 

© 对 于 每 个 语法 分 析 树 的 结 点 ， 比 如 一 个 标号 为 文法 符号 下 的 结 点 ， 和 开关 联 的 每 个 属性 

都 在 依赖 图 中 有 一 个 结 点 。 

e 假设 和 产生 式 p 关联 的 语义 规则 通过 c 的 值 定义 了 综合 属性 4.8 的 值 (这 个 规则 定义 
A. b 时 可 能 还 用 到 也 。 之 外 的 其 他 属性 )。 那 么 , 相应 的 依赖 图 中 有 一 条 从 对 c 到 4.5 
的 边 。 更 准确 地 讲 , 在 每 个 标号 为 4 且 应 用 了 产生 式 p HAAN 上 , 创建 一 条 从 该 产生 
式 体 中 的 符号 于 的 实例 所 对 应 的 N 的 子 结 点 上 的 属性 “到 六 上 的 属性 的 边 。9 


O 因为 一 个 结 点 人 可 能 有 多 个 标号 为 下 的 子 结 点 , 我 们 再 次 假设 使 用 下 标 来 区 分 同一 个 符号 在 这 个 产生 式 的 不 同 : 
REEMA UA . 





SERS 
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。 假 设 和 产生 式 p 关联 的 一 个 语义 规则 通过 Xa 的 值 定义 了 继承 属性 已 c 的 值 。 那 么 ,在 
相应 的 依赖 图 中 有 一 条 从 Xa 到 B. c 的 边 。 对 于 每 个 标号 为 B、 对 应 于 产生 式 p 中 的 这 
个 8 的 结 点 NN, 创建 一 条 从 结 点 M 上 的 属性 4 到 NN 上 的 属性 。 的 边 。 这 里 的 履 对 应 于 这 
AX, 请 注意 , M 可 以 是 N 的 父 结 点 或 者 兄弟 结 点 。 
考虑 下 面 的 产生 式 和 规则 : 
产生 式 语义 规则 
E> E +T Eval = Ei.val +T val 
EMIS E, 且 其 子 结 点 对 应 于 这 个 产生 式 体 的 结 点 N 上 , N 上 的 综合 属性 val 使 用 两 
个 子 结 点 (标号 分 别 为 和 7) 上 的 val 值 计算 得 到 。 因 此 , 对 于 每 个 使 用 了 这 个 产生 式 的 语法 分 
析 树 ,该 树 的 依赖 图 中 有 一 部 分 如 图 5-6 所 示 。 作 为 惯例 , 我 们 将 把 语法 分 析 树 的 边 显示 为 虚 
R, 而 依赖 图 的 边 显示 为 实 线 。 = 
[一 个 完整 的 依赖 图 的 例子 如 图 5-7 所 示 。 这 个 依赖 
图 的 结 点 用 数字 1 ~9 表示 ,对 应 于 图 5-5 中 的 注释 语法 分 本 
树 中 的 各 个 属性 。 站 ag eal 














结 点 1 和 2 表示 和 其 标号 为 digit 的 两 个 叶子 结 点 相关 联 o pE aA 
的 属性 lexval。 结 点 3 和 4 表示 和 其 标号 为 的 两 个 结 点 相关 - .val E. val 


联 的 属性 vol。 从 结 点 1 到 结 点 3 的 边 , 以 及 从 结 点 2 到 结 点 4 hi, 


的 边 是 根据 通过 SDD 中 digit. lexval 定义 F. val 的 语义 规则 得 到 的 。 MRL, Foal 等 于 
digit. lexval, 但 依赖 图 中 的 边 表示 的 是 依赖 关系 , 而 不 是 等 于 关系 。 
结 点 5 和 6 表示 和 非 终 结 符号 7 的 T 9yal 
各 次 出 现 相关 联 的 继承 属性 7'. inho M E 
结 点 3 到 结 点 5 KARIRA T's inh= 。 p a ON 
F. val 得 到 的 , 这 个 规则 根据 根 的 左 子 结 。 : weer 
AEK Pod 定义 了 右 子 结 点 上 的 digiti tecval :A 





Tinh。 我 们 看 到 了 从 结 点 5 到 结 点 6 的 


代表 7'. inh 的 边 和 从 结 点 4 到 结 点 5 的 PEE ada ; 
代表 F. val 的 边 , BWI MEARS | 
到 了 结 点 6 上 的 属性 inh 的 值 。 图 57 对 应 于 图 5-5 中 的 注释 语法 分 析 树 的 依赖 图 

结 点 7 和 8 表示 了 和 7' 的 各 次 出 现 相关 联 的 综合 属性 syn。 从 结 点 6 到 结 点 7 的 边 是 根据 图 
5-4 中 的 产生 式 3 所 关联 的 规则 T. syn =T. inh 得 到 的 。 从 结 点 7 到 结 点 8 的 边 是 根据 产生 式 2 
所 关联 的 语义 规则 得 到 的 。 

BUS, 结 点 9 表示 属性 T. vel。 从 结 点 8 到 结 点 9 的 边 是 根据 产生 式 1 所 关联 的 语义 规则 
T. val = T'. syn 而 得 到 的 。 Q 
5.2.2 属性 求 值 的 顺序 

依赖 图 刻画 了 对 一 棵 语法 分 析 树 中 不 同 结 点 上 的 属性 求 值 时 可 能 采取 的 顺序 。 如 果 依 赖 图 
中 有 一 条 从 结 点 M 到 结 点 NN 的 边 , 那么 要 先 对 MM 对 应 的 属性 求 值 , 再 对 N 对 应 的 属性 求 值 。 因 
此 , 所 有 的 可 行 求 值 顺序 就 是 满足 下 列 条 件 的 结 点 顺序 NI Ng oe Ny 如 果 有 一 条 从 结 点 Ni 到 
六 的 依赖 图 的 边 , 那么 i <j。 这 样 的 排序 将 一 个 有 向 图 变 成 了 一 个 线性 排序 , 这 个 排序 称 为 这 个 
图 的 拓扑 排序 (topological sort) 。 
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如 果 这 个 图 中 存在 任意 一 个 环 , 那么 就 不 存在 拓扑 排序 。 也 就 是 说 ,没有 办 法 在 这 棵 语法 分 
析 树 上 对 相应 的 SDD 求 值 。 然 而 , 如 果 图 中 没有 环 , 那么 总 是 至 少 存在 一 个 拓扑 排序 。 下 面 说 
明 一 下 为 什么 会 存在 拓扑 排序 。 因 为 没有 环 ,， 所 以 我 们 一定 能 够 找到 一 个 没有 边 进 入 的 结 点 。 
假设 没有 这 样 的 结 点 , 那么 我 们 就 可 以 不 断 地 从 一 个 前 驱 结 点 到 达 另 一 个 前 驱 结 点 , 直到 我 们 回 
到 某 个 已 经 访问 过 的 结 点 , 从 而 形成 了 一 个 环 。 令 这 个 没有 进入 边 的 结 点 为 拓扑 排序 的 第 一 个 
结 点 , 从 依赖 图 中 删除 这 个 点 , 并 对 其 余 的 结 点 重复 上 面 的 过 程 。( 最 终 就 可 以 得 到 一 个 拓扑 排 
序 一 译 者 注 。) 
DEG 25-7 中 的 依赖 图 没有 环 。 它 的 拓扑 排序 之 一 是 这 些 结 点 的 编码 的 顺序 : 1、2、…、9。 
请 注意 , 这 个 图 的 每 条 边 都 是 从 编号 较 低 的 结 点 指向 编号 较 高 的 结 点 , 因此 这 个 排序 一 定 是 拓扑 
EM. PEDE E HH 1, 3.5.2.4, 6,7, 8.9. a 
5.2.3 S 属性 的 定义 

前 面 提 到 过 ,给 定 一 个 SDD, 很 难 判定 是 否 存在 一 棵 其 依赖 图 包含 环 的 语法 分 析 树 。 在 实践 
H, E 年 过 程 可 以 使 用 某 些 特 定 类 型 的 SDD 来 实现 。 这 些 类 型 的 SDD 一 定 有 一 个 求 值 顺序 , A 
为 它们 不 允许 产生 带 有 环 的 依赖 图。 不 仅 如 此 ，; 这 一 节 中 介绍 的 两 类 SDD 可 以 和 自 顶 向 下 及 自 
底 向 上 的 语法 分 析 过 程 -- 起 高 效 地 实现 。 

第 一 种 SDD 类 型 的 定义 如 下 : 

。 如 果 一 个 SDD 的 每 个 属性 都 是 综合 属性 , 它 就 是 5 属性 的 。 
DE 25. 中 的 SDD 是 一 个 属性 定义 的 例子 。 其 中 的 每 个 属性 (Lval、E. val, 7. val 和 
F. val) 都 是 综合 属性 。 口 

如 果 一 个 SDD Æ S 属性 的 , 我 们 可 以 按照 语法 分 析 树 结 点 的 任何 自 底 向 上 顺序 来 计算 它 的 
各 个 属性 值 。 对 语法 分 析 树 进行 后 序 遍 历 并 对 局 性 求 值 常常 会 非常 简单 ， 当 遍历 最 后 一 次 离开 
i ee 
语法 分 析 树 的 根 上 ( 见 2. 3.4 节 中 的 “前 序 遍 历 和 后 序 遍 历 ” 部 分 ): 


postorder ( N) 
| for( 从 左边 开始 ,对 N 的 每 个 子 结 点 C)postorder( C); 
对 入 关联 的 各 个 属性 求 值 : 
| 
S 属性 的 定义 可 以 在 自 底 向 上 语法 分 析 的 过 程 中 实现 ,因为 一 个 自 底 向 上 的 语法 分 析 过 程 对 
应 于 一 次 后 序 饥 历 。 特 别 地 ,后 序 顺序 精确 地 对 应 于 一 个 LR 分 析 器 将 一 个 产生 并 休 归 约 成 为 它 
的 头 的 过 程 。 这 个 性 质 将 在 5.4.2 节 中 用 于 LR 语法 分 析 过 程 中 的 综合 属性 求 值 工作 ,这 些 信 将 
存放 在 分 析 栈 中 。 这 个 过 程 不 会 显 式 地 创建 语法 分 析 树 的 结 点 。 
5.2.4 上 属性 的 定义 
第 二 种 SDD 称 为 工 属 性 定义 (L-attributed definition) 。 这 类 SDD 的 思想 是 在 一 个 产生 式 体 所 
关联 的 各 个 属性 之 间 ,， 依赖 图 的 边 总 是 从 左 到 右 ， 而 不 能 从 右 到 左 ( 因 此 称 为 工 属性 的 ) 。 更 准 
确 地 讲 , 每 个 属性 必须 要 么 是 
。 一 个 综合 属性 , BAR | 
。 一 个 继承 属性 , 但 是 它 的 规则 具有 如 下 限制 。 假 设 存在 一 个 产生 式 4 一 XX ..X。, 并 且 
人 
使 用 ， 


1) 和 产生 式 头 4 关联 的 继承 属性 。 
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2) MF X; AWA SOE FES RKA AX XQ oe Xi FAR RRR ERE A RHE 
3) 和 这 个 总 的 实例 本 身 相 关 的 继承 属性 或 综合 属性 , 但 是 在 由 这 个 X; 的 全 部 属性 组 成 的 
依赖 图 中 不 存在 环 。 
Gee 图 5-4 PAY SDD 是 工 属性 的 。 要 知道 为 什么 ,考虑 对 应 于 继承 属性 的 语义 规则 。 为 方 
便 起 见 , 我们 在 这 里 再 重复 一 下 这 些 规则 : 
产生 式 语义 规则 
To FT Tinh = F.val 
TY PT!  Tlinh=T"inhx Fval 
其 中 的 第 一 个 规则 定义 继承 属性 了. inh 时 只 使 用 了 F. val, 且 玉 在 相应 产生 式 体 中 出 现在 TAYE 
部 , 因此 满足 L 属 性 的 要 求 。 第 二 个 规则 定义 Ti. inh 时 使 用 了 和 产生 式 头 相关 联 的 继承 属性 
T'. inh BG F. val, 其 中 下 在 这 个 产生 式 体 中 出 现在 T 的 左边 。 
从 语法 分 析 树 的 角度 看 ,在 每 一 种 情况 中 ， 当 这 些 规则 被 应 用 于 某 个 结 点 时 ， 它 使 用 的 信息 
“来 自 于 上 边 或 左边 ”的 语法 树 结 点 ,因此 满足 这 一 类 SDD 的 要 求 。 其 余 的 属性 是 综合 属性 ， 因 








此 这 个 SDD Æ L EHEH 口 
任何 包含 下 列 产生 式 和 规则 的 SDD 都 不 是 工 属 性 的 : 
i 产生 式 语义 规则 
A~BC A.s = B.b; 


Bi= f(C.c, A.s) 

第 一 个 规则 As =B.b 在 S$ 属性 SDD ML BYE SDD 中 都 是 一 个 合法 的 规则 。 它 通过 一 个 子 结 点 
(也 就 是 产生 式 体 中 的 一 个 符号 ) 的 属性 定义 了 综合 属性 4. so 

第 二 个 规则 定义 了 一 个 继承 属性 B. i, 因此 整个 SDD 不 可 能 是 S 属性 的 。 不 仅 如 此 ， 昌 然 这 
个 规则 是 合法 的 , 这 个 SDD 也 不 可 能 是 工 属性 的 ,因为 属性 C.c 用 来 定义 B.i, 并 且 C 在 产生 式 
体 中 位 于 B 的 右边 。 虽 然 在 L 属性 的 SDD 中 可 以 使 用 语法 分 析 树 中 的 兄弟 结 点 的 属性 , 但 这 些 
结 点 必须 位 于 被 定义 属性 的 符号 的 左边 。 口 
5.2.5 县 有 受 控 副 作用 的 语义 规则 

在 实践 中 ,翻译 过 程 会 出 现 一 些 副作用 : 一 个 桌 上 计算 器 可 能 打印 出 一 个 结果 ; 一 个 代码 生 
成 器 可 能 把 一 个 标识 符 的 类 型 加 入 到 符号 表 中 。 对 于 SDD, 我 们 在 属性 文法 和 翻译 方案 之 间 找 
到 了 一 个 平衡 点 。 属 性 文法 没有 副作用 , 并 支持 任何 与 依赖 图 一 致 的 求 值 顺序 。 翻 译 方案 要 求 
按 从 左 到 右 的 顺序 求 值 , 并 允许 语义 动作 包含 任何 程序 片段 。 翻 译 方案 将 在 5.4 节 中 讨论 。 

我 们 将 按照 下 面 的 方法 之 一 来 控制 SDD 中 的 副作用 : 

e 支持 那些 不 会 对 属性 求 值 产生 约束 的 附带 副作用 。 换 名 话说 , 如 果 按 照 依赖 图 的 任何 拓 
扑 顺序 进行 属性 求 值 时 都 可 以 产生 “正确 的 ”翻译 结果 , 我 们 就 允许 副作用 存在 。 这 里 的 
“正确 "要 视 具 体 应 用 而 定 。 
对 允许 的 求 值 顺 序 添 加 约束 , 使 得 以 任何 允许 的 顺序 求 值 都 会 产生 相同 的 翻译 结果 。 这 
些 约束 可 以 被 看 作 隐 含 加 入 到 依赖 图 中 的 边 。 

作为 附带 副作用 的 一 个 例子 , 让 我 们 修改 例 5.1 的 桌 上 计算 嚣 , 使 它 打印 出 计算 结果 。 我 们 
不 使 用 规则 L. val = E. vol， 这 个 规则 将 结果 保存 到 综合 属性 二 val 中。 我 们 考虑 : 


产生 式 语义 规则 
1) LoEn print( E. val) 


像 print( E. val) 这 样 的 语义 规则 的 目的 就 是 执行 它们 的 副作用 。 它 们 将 会 被 看 作 与 相应 产生 式 关 
相关 的 哑 综 合 属性 的 定义 。 这 个 经 过 修改 的 SDD 在 任何 拓扑 顺序 下 都 能 产生 相同 的 值 ,因为 这 
个 打印 语句 在 结果 被 计算 到 E. val 中 之 后 才 会 被 执行 。 


202 第 5 章 











图 5-8 中 的 SDD 处 理 了 简单 的 声明 D。 该 声明 中 包含 一 个 基本 类 型 7, 后 跟 一 个 标识 
符 列 表 L。7 的 类 型 可 以 是 int 或 oat。 对 于 列表 中 的 每 个 标识 符 ， 这 个 类 型 被 录 人 到 标识 符 的 
符号 表 条 目 中 。 我 们 假设 录入 一 个 标识 符 的 类 型 不 会 影响 其 他 标识 符 对 应 的 符号 表 条 目 。 这 样 ， 
这 些 条 目 可 以 按照 任何 顺序 进行 更 新 。 这 个 SDD 不 会 检查 一 个 标识 符 是 否 被 声明 了 多 次 , 我 们 
也 可 以 修改 这 个 SDD ,使 它 能 够 对 标识 符 声 明 次 数 进行 检查 。 

非 终结 符号 D 表示 了 一 个 声明 。 根 据 产生 式 1 — — ~ 
eee Fiat on Ex 产生 式 语义 规则 | 
可 知 , 这 个 声明 包含 一 个 类 型 7, 后 跟 一 个 标识 符 的 “| 
列表 。T 有 一 个 属性 7. type, 它 是 声明 DD 中 的 类 型 。 2) Tint T.type = integer 
非 终结 符 号 工 也 有 一 个 属性 , 我 们 称 它 为 inh, 以 强 |3) T+ float | T.type = float 
调 它 是 一 个 继承 属性 。L. inh 的 作用 是 将 声明 的 类 | | ns enny Linh) 
型 沿 着 标识 符 列 表 向 下 传递 ,使 得 它 可 以 被 加 入 到 | 5) bia add Type(id.entry, L-inh) 
相应 的 符号 表 条 目 中 。 

产生 式 2 和 产生 式 3 都 计算 综合 属性 7. type, 为 图 5-8 简单 类 型 声明 的 语法 制导 定义 
它 赋 予 正 确 的 值 : integer 或 float。 这 个 类 型 值 在 产生 式 1 的 规则 中 被 传递 给 属性 二. inh。 产 生 式 4 
KL. ink 沿 着 语法 分 析 树 向 下 传递 。 也 就 是 说 ,在 一 个 分 析 树 结 点 上 , E L. inh 是 通过 拷贝 该 结 
点 的 父 结 点 的 上 . inh 值 而 得 到 的 ,这 个 父 结 点 对 应 于 此 产生 式 的 头 。 

产生 式 4 和 产生 式 5 还 包含 另 一 个 规则 。 该 规则 用 如 下 两 个 参数 调用 函数 addType: 

o id. entry; 在 词法 分 析 过 程 中 得 到 的 一 个 指向 某 个 符号 表 对 象 的 值 。 

© Linh: 被 赋 给 列表 中 各 个 标识 符 的 类 型 值 。 

我 们 假设 函数 cdd7ype 正确 地 将 id 所 代表 的 标识 符 的 类 型 设置 为 类 型 值 L. inho 

输入 串 float id, , id ,ids 的 依赖 图 如 图 5-9 所 示 。 数 字 1 ~ 10 表示 了 这 个 依赖 图 中 的 结 点 。 
结 点 1、2 和 3 表示 了 和 各 个 标号 为 id 的 叶子 结 点 相关 的 属性 entry。 结 点 6、8 和 10 BEM MA 
addType 的 应 用 于 一 个 类 型 和 这 些 entry 值 之 -一 的 哑 属 性 。 

结 点 4 表示 属性 ? ype, 它 实际 上 是 属 D 
性 求 值 过 程 开始 的 地 方 。 然 后 , 这 个 类 型 被 po 
传递 到 结 点 5、7 和 9。 这些 结 点 表示 和 非 终 




















DATL Linh = T. type 











结 符号 区 的 各 次 出 现 相 关 的 二 . inh, 口 A 4 type inh Ca 
5.2.6 5.2 节 的 练习 we a ae 
练习 5.2. 1: 图 5-7 中 的 依赖 图 的 全 inh Td entry 
部 拓扑 排序 有 哪些 ? we aS | 
练习 5. 2. 2: 对 于 图 5-8 中 的 SDD, 4 nh g ~L "10 entry 2 2 entry 
出 下 列表 达 式 对 应 的 注释 语法 分 析 树 : =~~ 
1) int a, b, c idi. 1 entry 


2) float w, x,y, z 

练习 5.2.3: 假设 我 们 有 一 个 产生 式 
A 一 BCD。4、B、C、D 这 四 个 非 终结 符号 都 有 两 个 属性 : s 是 一 个 综合 属性 , 而; 是 一 个 继承 属 
性 。 对 于 下 面 的 每 组 规则 , 指出 (i) 这 些 规 则 是 否 满足 S 属性 定义 的 要 求 。(ii) 这 些 规 则 是 否 满 
足 工 属性 定义 的 要 求 。( 这 ) 是 否 存在 和 这 些 规则 一 致 的 求 值 过 程 ? 

1)4s = Boi + Cs 

2)A.s = Bi + CsMD.i = Ai + Bes 


图 5-9 声明 float id, , id,, id, 的 依赖 图 








GE ih) FAY HIE 203 


一 一 一 : 





3) A.s = Bs + Dis 

14) As = Di, BisaAst Cs, CisbsMDi = Bit Ci 

! 练习 5.2. 4: 这 个 文法 生成 了 含 “ 小 数 点 ”的 二 进 制 数 : 
S>L.L|L 


LoLB\B 
B—0|1 


设计 一 个 工 属 性 的 SDD 来 计算 S. val, 即 输入 串 的 十 进 制 数 值 。 比 如 , 串 101. 11 应 该 被 翻译 
为 十 进 制 数 5. 635。 提 示 : 使 用 一 个 继承 属性 元 side 来 指明 一 个 二 进 制 位 在 小 数 点 的 哪 一 边 。 

11 练习 5.2.5: 为 练习 5.2.4 中 描述 的 文法 和 翻译 设计 一 个 S 属 性 的 SDD。 

11 练习 5.2.6: 使 用 一 个 自 顶 向 下 语法 分 析 文 法 上 的 工 属性 SDD 来 实现 算法 3.23。 这 个 算 
法 把 一 个 正则 表达 式 转换 为 一 个 不 确定 的 有 穷 自 动机 。 假 设 有 一 个 表示 任意 字符 的 词法 单元 
char, 并 且 char. lexval 是 它 所 表示 的 字符 。 你 可 以 假设 存在 一 个 函数 newl ), 该 函数 返回 一 个 新 
的 状态 , 也 就 是 一 个 之 前 尚未 被 这 个 函数 返回 的 状态 。 使 用 任何 方便 的 表示 方式 来 描述 这 个 
NFA 的 翻译 。 


5. 3 ”语法 制导 翻译 的 应 用 


本 章 中 的 语法 制导 的 翻译 技术 将 在 第 6 章 中 用 于 类 型 检查 和 中 间 代码 生成 。 这 里 , 我 们 将 给 
出 一 些 例子 来 解释 有 代表 性 的 SDD。 | 
本 节 中 的 主要 应 用 是 抽象 语法 树 的 构造 。 因 为 有 些 编译 器 使 用 抽象 语法 树 作为 一 种 中 间 表 
示 形式 , 所 以 一 种 常见 的 SDD 形式 将 它 的 输入 串 转换 为 一 棵 树 。 为 了 完成 到 中 间 代码 的 翻译 ， 
编译 器 接 下 来 可 能 使 用 一 组 规则 来 编译 这 棵 语法 树 。 这 些 规则 实际 上 是 一 个 建立 于 语法 树 之 上 
i) SDD, 而 通常 的 SDD 建立 于 语法 分 析 树 之 上 。( 第 6 章 将 讨论 应 用 一 个 SDD 来 生成 中 间 代码 的 
方法 ,这 个 方法 不 需要 显 式 地 生成 树 。) 
我 们 考虑 两 个 为 表达 式 构造 语法 树 的 SDD。 第 一 个 是 一 个 $ 属 性 定义 , 它 适合 在 自 底 向 上 请 
法 分 析 过 程 中 使 用 。 第 二 个 是 一 个 属性 定义 , 它 适 合 在 自 顶 向 下 的 语法 分 析 过 程 中 使 用 。 
本 节 的 最 后 一 个 例子 是 一 个 处 理 基 本 类 型 和 数组 类 型 的 属性 定义 。 
5.3.1 ”抽象 语法 树 的 构造 
2. 8. 2 节 讨论 过 ,一 棵 语法 树 中 的 每 个 结 点 代表 一 个 程序 构造 , 这 个 结 点 的 子 结 点 代表 这 个 
构造 的 有 意义 的 组 成 部 分 。 表 示 表达 式 El +E, 的 语法 树 结 点 的 标号 为 +， 且 两 个 子 结 点 分 别 代 
表 子 表达 式 Bl A Ey. 
我 们 将 使 用 具有 适当 数量 的 字段 的 对 象 来 实现 一 桔 语法 树 的 各 个 结 点 。 每 个 对 象 将 有 一 个 
op 字段 ,也 就 是 这 个 结 点 的 标号 。 这 些 对 象 将 具有 如 下 所 述 的 其 他 字段 
。 如果 结 点 是 一 个 叶子 ,那么 对 象 将 有 一 个 附加 的 域 来 存放 这 个 叶子 结 点 的 词法 值 。 构 造 
函数 Leaf op, val) 创建 一 个 叶子 对 象 。 我 们 也 可 以 把 结 点 看 作 记录 , 那么 Leaf 就 会 返回 
一 个 指向 与 叶子 结 点 对 应 的 新 记录 的 指针 。 
。 如 果 结 点 是 内 部 结 点 , 那么 它 的 附加 字段 的 个 数 和 该 结 点 在 语法 树 中 的 子 结 点 个 数 相同 。 
HE PAL Node 带 有 两 个 或 多 个 参数 : Node(op, ci, Cy, °°, h), 该 函数 创建 一 个 对 象 , 第 
一 个 字段 的 值 为 op, 其余 大 个 字段 的 值 为 c ,…，ck。 
EEN 5-10 中 的 s 属性 定义 为 一 个 简单 的 表达 式 文法 构造 出 语法 树 。 这 个 文法 只 包含 二 
目 运算 符 + 和 - HM, 这 两 个 运算 符 具 有 相同 的 优先 级 ， 并且 都 是 左 结合 的 。 所 有 的 非 终结 符 
号 都 有 一 个 综合 属性 node, 该 属性 表示 相应 的 抽象 语法 树 结 点 。 
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每 当 使 用 第 一 个 产生 式 ESE, + 了 时 , 它 的 语义 规则 就 创建 出 一 个 结 点 。 创 建 时 使 用 * +" 作 
H op, WEFT Ey. node 和 了 node 作为 代表 子 表达 式 的 两 个 子 结 点 。 第 二 个 产生 式 也 有 类 似 的 规则 。 














FER 
1) E> E +T E.node = new Node(’+', E; node, T.node) 
2) E> E -T E.node = new Node('—', E; .node, T.node) 
3) E27 | E.node = T.node 
4) T= (E) T.node = E.node 
5) Tid T.node = new Leaf(id, id.entry) 
6) T => num T.node = new Leaf (num, num.val) 








图 5-10 为 简单 表达 式 构造 语法 树 

FERS, MEST, 没有 创建 任何 结 点 ,因为 已 node 和 了 node 是 一 样 的 。 类 似 地 , 产生 式 
4, T(E), 也 没有 创建 任何 结 点 。T. node 的 值 和 E. node 的 值 相同 , 因为 括号 仅仅 用 于 分 组 。 
它们 会 影响 语法 分 析 树 和 抽象 语法 树 的 结构 , 但 是 一 旦 分 组 完成 ,就 不 需要 在 抽象 语法 树 中 保留 
这 些 括 号 了 。 

最 后 两 个 7- 产生 式 的 右 部 是 一 个 终结 符号 。 我 们 使 用 构造 函数 Leaf 来 创建 合适 的 结 点 。 这 
些 结 点 就 成 为 7. node 的 值 。 

图 5-11 显示 了 为 输入 a -4+c 构造 一 棵 抽象 语法 树 的 过 程 。 这 棵 抽象 语法 树 的 结 点 被 显示 
为 记录 。 这 些 记录 的 第 一 个 字段 是 p, MWE, 抽象 语法 树 的 边 用 实 线 表示 。 基 础 的 语法 分 析 树 
使 用 点 虚线 表示 边 。 实 际 上 不 需要 生成 语法 分 析 树 。 第 三 种 线 是 虚线 , CRR E. node 和 了 node 
的 值 。 每 条 线 都 指向 适当 的 抽象 语法 树 结 点 。 


E.node 
Pe eis 
my 
E.nodé’ + `” T.node 
ee : aye \ 
E.node 一 T node id 
ae fos ; 
A + Š 1 
i : , ， 
/了 node t ‘ num i 
4 7 J 
1 











to entry for c 

















to entry for a 
图 5-11 a-4 +c 的 抽象 语法 树 


在 最 底 端 , 我 们 可 以 看 到 由 Leaf 构造 得 到 的 分 别 表示 a、4 和 。 的 叶子 结 点 。 我 们 假设 词法 
{E id. entry 指向 符号 表 , 并 且 词 法 值 num. val 是 一 个 常量 值 。 根 据 规则 5 和 6, 这 些 叶子 结 点 ,或 
指向 它们 的 指针 , 变 成 了 图 中 的 三 个 标号 为 了 的 语法 分 析 树 结 点 上 的 T. node 的 值 。 请 注意 , 根 
据 规 则 3， 指 向 a 对 应 的 叶子 结 点 的 指针 同时 也 是 语法 分 析 树 中 最 左边 的 巨 的 尼 node 值 。 

我 们 根据 规则 2 创建 了 一 个 结 点 ,该 结 点 的 op PRETRES, 它 的 指针 指向 前 两 个 叶子 结 
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点 。 然 后 , 规则 1 将 对 应 于 - 的 结 点 和 第 三 个 叶子 组 合 起 来 ， 得 到 这 个 抽象 语法 树 的 根 结 点 。 
如 果 这 些 规则 是 在 对 语法 分 析 树 的 后 序 饥 历 过 程 中 求 值 
的 , 或 者 是 在 自 底 向 上 分 析 过 程 中 和 归 约 动作 一 起 进行 求 什 
的 , 那么 当 图 5-12 中 显示 的 一 系列 步骤 结束 时 ,ps 指向 构造 得 
到 的 抽象 语法 树 的 根 结 点 。 
如 果 使 用 一 个 为 自 顶 向 下 语法 分 析 而 设计 的 文法 , 那么 得 
到 的 抽象 语法 树 仍然 相同 ,其 构造 的 步骤 也 相同 , 虽然 语法 分 “图 5-12 4a-4+c 的 抽象 语法 树 
析 树 的 结构 和 抽象 语法 树 的 结构 有 极 大 的 不 同 。 的 构造 步 又 
ORA 图 5-13 中 的 L 属 性 定义 完成 的 翻译 工作 和 图 5-10 中 的 S 属 性 定义 所 完成 工作 的 相 
同 。 XERE E, T, id 和 num 的 属性 和 例 5-11 中 讨论 的 相同 。 





pı = new Leaf(id, entry-a); 
po = new Leaf (num, 4); 

ps = new Node('—',p1, p2); 
pa = new Leaf (id, entry-c); 
ps = new Node('+',p3, pa); 





Cn w ee 
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产生 式 语义 规则 

1) ESTE E.node = E'.syn 
-E' inh = T.node 

2) E'++TE\ | Ei.inh=new Node('+', E' inh, T.node) 
E' syn = E; -syn 

3) Bl! +-TE! | El.inh= new Node('—', B'.inh,T node) 
E'.syn = E; -syn 

4) E'-+e E' syn = El inh 

5) T(E) T:node = E.node 

6) 了 一 id T.node = new Leaf (id, id. entry) 

7) T > num T.node = new Leaf (num, num.val) 


图 5-13 在 自 顶 向 下 语法 分 析 过 程 中 构造 抽象 语法 树 

a a th EIA HL AN] 5. 3 中 旧 上 计算 器 的 规则 类 似 。 在 桌 上 计算 器 的 例 
子 中 , 项 x*y 中 的 x 和 *y 位 于 语法 分 析 树 的 不 同 部 分 , 因此 在 计算 x*y 时 x 是 作为 继承 属性 传 
递 的 。 oe AN 2 + HERE 在 法 树 时 将 * 作为 一 个 继承 属性 传递 , 因为 x 和 +y 出 现 
在 不 同 的 子 树 中 。 非 终结 符号 E' 对 应 于 例 5.3 中 的 非 终 结 符号 7'。 请 比较 一 下 图 5-14 中 & -4+e 
的 依赖 图 和 图 5-7 中 3 *4 的 依赖 图 的 相似 之 处 。 

非 终结 符号 EF 有 一 个 继承 属性 inh 和 一 个 综合 属性 smo RIE E. inh 表示 至 今 为 止 构造 得 到 
的 部 分 抽象 语法 树 。 明 确 地 说 , 它 表示 的 是 位 于 E' 的 子 树 左 边 的 输入 串 前 级 所 对 应 的 抽象 语法 
树 的 根 。 在 图 5-14 中 依赖 图 的 结 点 5 处 ,BE'. inh 表示 对 应 于 a 的 抽象 语法 树 的 根 , 实际 上 就 是 对 
应 于 a 的 叶子 结 点 。 在 结 点 6 处 , E'. ink 表示 对 应 于 输入 a -4 的 部 分 抽象 语法 树 的 根 。 在 结 点 9 
Ah, E'. inh 表示 a 一 4 +c 的 抽象 语法 树 。 


.EB 13 gode 


T 2 hode "OS 


id 1 entry T T 1 node mh 6 El SY 


T 
e nee ey Ae 


num | val + T 8 node ink 


id | entry : 


图 5-14 使 用 图 5-13 中 的 SDD 时 的 ec-4+c 的 依赖 图 


AR 











因为 没有 更 多 的 输入 , 所 以 在 结 点 9 处 , E’. ink 指向 整个 抽象 语法 树 的 根 。 属 性 syn 把 这 个 值 沿 着 
语法 分 析 树 向 上 传递 , 直到 它 成 为 已 node 的 值 。 明 确 地 讲 , 结 点 10 上 的 属性 值 是 通过 产生 式 已 一 e 所 
关联 的 规则 EB" syn = E'. inh 来 定义 的 。 在 结 点 11 处 的 属性 值 是 通过 图 5-13 中 与 产生 式 2 相关 的 规则 


E'. syn =E'1. syn 来 定义 的 。 类 似 的 规则 还 定义 了 结 点 12 和 13 处 的 值 。 0 
5.3.2 类 型 的 结构 
当 语 法 分 析 树 的 结构 和 输入 的 抽象 语法 树 的 结构 不 同时 , 继承 属性 是 很 有 用 的 。 在 这 种 情 


况 下 , 继承 属性 可 以 用 来 将 信息 从 语法 分 析 树 的 一 部 分 传递 到 另 一 部 分 。 下 一 个 例子 显示 了 这 
种 结构 上 的 不 匹配 可 能 是 由 语言 设计 引起 的 ， 而 不 是 由 语法 分 析 方法 的 约束 引起 的 。 
URE 在 C 语言 中 , Kw int [2][3] 可 以 读 作 :“ 由 两 个 数组 组 成 的 数组 , 子 数组 中 有 三 个 
整数 ”。 相 应 的 类 型 表达 式 array(2, array(3, integer) ) 可 以 使 用 图 5-15 a 
中 的 树 来 表示 。 运 算 符 aray 有 两 个 参数 , 一 个 是 数字 , 另 一 个 是 类 型 。 ， arra 
如 果 使 用 树 来 表示 类 型 ,那么 这 个 运算 符 返 回 一 个 标号 为 uroy Eg Nigar 
点 ， 该 结 点 具有 两 个 子 结 点 ， 分 别 表示 数字 和 类 型 。 

使 用 图 5-16 中 的 SDD, 非 终结 符号 了 生成 的 是 一 个 基本 类 型 或 -- 图 515 intt2jf3] 
个 数组 类 型 。 非 终结 符号 B 生成 基本 类 型 int 和 float 之 --。 当 7 推导 。 ”5 的 类 型 表达 式 
出 BC ELC 推导 出 e 时 ,7 生成 一个 基本 类 型 。 否则 , C 就 生成 由 一 个 整数 序列 组 成 的 数组 描述 
分 量 , 其 中 的 每 个 整数 用 方 括号 括 起 。 








非 终 结 符号 B 和 了 有 一 个 表示 类 型 的 综合 属性 二 二 二 = 
xz 语义 规则 
to 非 终 结 符号 C 有 两 个 属性 : 一 个 继承 属性 b 和 一 T => BC Ti=Ct 
个 综合 属性 1。 继承 属性 将 一 个 基本 类 型 沿 着 树 Cb= Bi 
向 下 传播 , 而 综合 属性 ! 则 收集 最 终 得 到 的 结果 。 | 二 了， ae 
输入 串 int[ 2 | [3] 的 注释 语法 分 析 树 如 图 5-17 C 一 [num ] Cy Ct = array(num.val, C,.t) 
所 示 。 图 5-15 中 的 相应 类 型 表达 式 的 构造 过 程 如 














下 : 首先 类 型 integer 从 B 开始 , 沿 着 C 组 成 的 链 通 
过 继承 属性 5 向 下 传递 。 最 后 的 数组 类 型 是 沿 着 C 图 5-16 了 生成 一 个 基本 类 型 或 一 个 数组 类 型 
组 成 的 链 、 通 过 属性 上 不 断 向 上 传递 并 综合 而 得 到 的 。 


T.t = array(2, array(3, integer)) 





B.t = integer Cb tnteger 
t= ge Ct= re integer)) 
ite | Pe C.b = integer 


t= array(3, integer) 


C 
| yy por = integer 


Ct = integer 





€ 
图 5-17 数组 类 型 的 语法 制导 的 翻译 


更 详细 地 讲 , 在 产生 式 TBC 对 应 的 根 结 点 上 ，, 非 终结 符号 C 使 用 继承 属性 C.5b 从 B 那里 
继承 类 型 。 在 最 右边 的 C 结 点 上 的 产生 式 是 Coe, 因此 Ct EFC bo PER C 一 [num]Ci 的 
语义 规则 将 运算 符 array 作用 到 运算 分 量 num. val 和 Ci 上 上， 得 到 C.1 的 值 。 口 
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5.3.3 5.3 节 的 练习 
练习 5. 3. 1: 下 面 是 涉及 运算 符 + 和 整数 或 浮 点 运算 分 量 的 表达 式 的 文法 。 区 分 浮 点 数 的 方 
法 是 看 它 有 无 小 数 点 。 


EE+TI|IT 
T -» num . num | num 


1) 给 出 一 个 SDD 来 确定 每 个 项 7 和 表达 式 的 类 型 。 

2) 扩展 (a) 中 得 到 的 SDD, 使 得 它 可 以 把 表达 式 转换 成 为 后 缀 表达 式 。 使 用 一 个 单 目 运算 
符 intToFloat 把 一 个 整数 转换 为 相等 的 浮 点 数 。 

| 练习 5. 3.2: 给 出 一 个 SDD, 将 一 个 带 有 + 和 * 的 中 组 表达 式 翻 译 成 没有 宛 余 括号 的 表达 
Ro EW, 因为 两 个 运算 符 都 是 左 结合 的 , IFA * 的 优先 级 高 于 + ,所 以 ((a* (b+c)) * (d)) 
可 翻译 为 a* (b+c) +d, 

! 练习 5. 3.3: 给 出 一 个 SDD 对 x* (3 *x+x*x) 这 样 的 表达 式 求 微分 。 表 达 式 中 涉及 运算 
符 + 和 *、 变 量 x 和 常量 。 假 设 不 进行 任何 简化 , 也 就 是 说 ， 比 如 3 *x 将 被 翻译 为 3 *1 +0 *x。 


5.4 语法 制导 的 翻译 方案 


语法 制导 的 翻译 方案 是 语法 制导 定义 的 一 种 补充 。5. 3 节 中 的 所 有 语法 制导 定义 的 应 用 都 可 
以 使 用 语法 制导 的 翻译 方案 来 实现 。 

根据 2.3.5 节 的 介绍 可 知 , 语法 制导 的 翻译 方案 (syntax-directed translation scheme, SDT) 是 在 
其 产生 式 体 中 嵌入 了 程序 片段 的 一 个 上 下 文 无 关 文法 。 这 些 程序 片段 称 为 语义 动作 , 它们 可 以 
出 现在 产生 式 体 中 的 任何 地 方 。 按 照 惯例 , 我 们 在 这 些 动 作 两 边 加 上 花 括号 。 如 果 花 括号 要 作 
为 文法 符号 出 现 , 则 要 给 它们 加 上 引号 。 

任何 SDT 都 可 以 通过 下 面 的 方法 实现 : 首先 建立 一 棵 语法 分 析 树 , 然后 按照 从 左 到 右 的 深度 
优先 顺序 来 执行 这 些 动 作 , 也 就 是 说 在 一 个 前 序 遍 历 过 程 中 执行 。5. 4.3 节 将 给 出 一 个 这 样 的 
例子 。 

通常 情况 下 , SDT 是 在 语法 分 析 过 程 中 实现 的 , 不 会 真 的 构造 一 棵 语法 分 析 树 。 在 本 节 中 ， 
我 们 主要 关注 如 何 使 用 SDT 来 实现 两 类 重要 的 SDD: 

1) 基本 文法 可 以 用 LR 技术 分 析 , 且 SDD ES 属性 的 。 

2) 基本 文法 可 以 用 LL 技术 分 析 , 且 SDD 是 世 属 性 的 。 

我 们 将 会 看 到 , 在 这 两 种 情况 下 , 一 个 SDD 中 的 语义 规则 是 如 何 被 转换 成 为 一 个 带 有 语义 
动作 的 SDT 的 。 这 些 动作 将 在 适当 的 时 候 执行 。 在 语法 分 析 过 程 中 , 产生 式 体 中 的 一 个 动作 在 
它 左边 的 所 有 文法 符号 都 被 匹配 之 后 立刻 执行 。 

可 以 在 语法 分 析 过 程 中 实现 的 SDT 可 以 按照 如 下 的 方式 识别 : HET ARATE ER 
为 一 个 独 有 的 标记 非 终 结 符号 (marker nonterminal)。 每 个 标记 非 终结 符号 M 只 有 一 个 产生 式 
MM 一 e。 如 果 带 有 标记 非 终 结 符号 的 文法 可 以 使 用 某 个 方法 进行 语法 分 析 , 那么 这 个 SDT 就 可 以 在 
语法 分 析 过 程 中 实现 。 

5.4.1 后 缀 翻译 方案 

至 今 为 止 , 最 简单 的 实现 SDD 的 情况 是 文法 可 以 用 自 底 向 上 方法 来 分 析 且 该 SDD 是 S 属性 
定义 。 在 这 种 情况 下 , 我 们 可 以 构造 出 一 个 SDT, 其 中 的 每 个 动作 都 放 在 产生 式 的 最 后 , 并 且 在 
按照 这 个 产生 式 将 产生 式 栖 归 约 为 产生 式 头 的 时 候 执行 这 个 动作 。 所 有 动作 都 在 产生 式 最 右 端 
的 SDT 称 为 后 组 翻译 方案 。 

DEER 15-18 中 的 后 级 SDT 实现 了 图 5-1 中 的 桌 上 计算 器 的 SDD。 其 中 只 有 一 处 改动 : 第 
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一 个 产生 式 的 动作 是 打印 出 结果 值 。 其 余 的 语义 动作 和 原来 的 语义 规则 对 应 的 动作 完全 一 样 。 
因为 此 SDD 的 基本 文法 是 LR 的 , 并 且 这 个 SDD 是 S 属性 的 , 所 以 这 些 动作 可 以 和 请 法 分 析 器 的 
归 约 步骤 一 起 正确 地 执行 。 口 
5.4.2 AA SDT 的 语法 分 析 栈 实现 

JAB SDT 可 以 在 LR 语法 分 析 的 过 程 中 实现 ， 





En { print(Z-.val); } 
B+t+T {BE.val= E,.val+ T.val; } 


当归 约 发 生 时 执行 相应 的 语义 动作 。 各 个 文法 符号 PO e aes 
的 属性 值 可 以 放 到 栈 中 的 某 个 位 置 ERTA pF { Tval= Fuk} 


(E) { F.val = E.val; } 
digit { F.val = digit.lerval, } 


的 时 候 可 以 找到 它们 。 最 好 的 方法 是 将 属性 和 文法 
符号 (或 者 表示 文法 符号 的 LR 状态 ) 一 起 放 在 栈 中 
的 记录 里 。 图 5-18 实现 桌 上 计算 器 的 后 缀 SDT 
在 图 5-19 中 ,语法 分 析 栈 包含 的 记录 中 有 一 个 

字段 , 该 字段 用 于 存放 文法 符号 (或 语法 分 析 器 的 状态 ), 并 且 在 这 个 字段 之 下 有 一 个 字段 用 于 
存放 属性 。 三 个 文法 符号 与 了 2 位 于 栈 的 顶部 , 可 能 它们 即将 按照 一 个 产生 式 ， 比 如 4 一 和 了 2 ， 
进行 归 约 。 这 里 , RAT X x RXTE, 等 等 。 一 般 来 说 , 我 们 可 以 支持 多 个 属性 , 方 
法 是 使 记录 变 得 足够 大 , 或 者 在 栈 中 的 记录 里 放 上 指针 。 对 于 小 型 的 属性 , 将 记录 变 得 足够 大 可 
能 是 比较 简单 的 方法 ,即使 有 些 时 候 有 些 字段 不 会 被 用 到 也 没有 太 大 关系 。 然 而 ， 如果 一 个 或 多 
个 属性 的 大 小 没有 限制 ， 比 如 它们 是 字符 只 ,那么 最 好 把 一 个 指针 放 到 栈 记录 的 属性 值 中 , 并 把 
实际 的 值 存放 在 栈 之 外 的 某 个 比较 大 的 共享 存储 区 域 中 。 
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如 果 所 有 属性 都 是 综合 属性 ,并且 所 有 动作 都 XY] 2) 状态 /文法 符号 
位 于 产生 式 的 末端 , 那么 我 们 可 以 在 把 产生 式 体 归 [Xs|Yy| 2.2| 综合 属性 
约 成 产生 式 头 的 时 候 计 算 各 个 属性 的 值 。 如 果 我 们 
使 用 ASXYZ 这 样 的 产生 式 进 行 归 约 , 那么 此 时 六 、 HR 
Y 和 和 2 的 所 有 属性 值 都 是 可 用 的 , 并且 都 位 于 已 知 图 5-19 ” 带 有 用 于 存放 综合 属性 的 
的 位 置 上 ， 如 图 5-19 所 示 。 在 这 个 动作 之 后 , 4 和 字段 的 语法 分 析 栈 
它 的 属性 都 位 于 栈 的 顶端 , 即 现在 存放 X 的 记录 的 
位 置 上 。 


RE 让 我 们 重 写 例 5. 14 中 桌 上 计算 器 SDT 中 的 动作 , 使 它们 显 式 地 操作 语法 分 析 栈 。 这 
样 的 栈 操作 通常 是 由 语法 分 析 器 自动 完成 的 。 

假设 语法 分 析 栈 存 放 在 一 个 被 称 为 stack 的 记录 数组 中 , 而 top 是 指向 栈 顶 的 游标 。 这 样 ， 
stack[ top | 指向 这 个 栈 的 栈 顶 记录 ,stact[ top -1] 指 向 栈 顶 记录 的 下 一 个 记录 , 依 此 类 推 。 我 们 还 
假设 每 个 记录 有 一 个 被 称 为 val 的 字段 , 该 字段 存放 了 这 个 记录 所 代表 的 文法 符号 的 属性 值 。 这 
RE, 我 们 可 以 使 用 siack[ top -2]. val 来 指向 出 现在 栈 中 第 三 个 位 置 上 的 属性 E. valo SERRI SDT 
显示 在 图 5-20 中 。 

比如 , 在 第 二 个 产生 式 ESE, + 了 中 ,我们 在 栈 项 之 下 两 个 位 置 上 找到 局 的 值 , 在 栈 顶 找到 
7 的 值 。 求 和 的 结果 放 在 归 约 之 后 产生 式 头 已 将 出 现 的 位 置 上 , 也 就 是 当前 栈 顶 之 下 两 个 位 置 
处 。 这 是 因为 在 归 约 之 后 ,最 上 面 的 三 个 符号 将 被 蔡 换 为 一 个 符号 。 在 计算 完 已 val 之 后 , 我们 
将 两 个 符号 弹出 栈 , 现在 我 们 放置 已 val 的 记录 将 变 成 栈 顶 。 

在 第 三 个 产生 式 ET 中 不 需要 任何 语义 动作 , 因为 栈 的 长 度 没 有 改变 , RIH T val 值 直接 变 成 
了 Eval 的 值 。 产 生 式 T>F 和 wigit 的 情况 与 此 类 似 。 产 生 式 P(E) 稍 有 不 同 。 虽 然 值 没有 改 
变 , 但 是 在 妇 约 过 程 中 消除 了 栈 中 的 两 个 位 置 , 因此 这 个 值 必 须 移动 到 归 约 之 后 的 位 置 上 。 
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产生 式 语义 动作 

L> En { print(stack [top — 1].val); 
top = top — 1; } 

E> E +T { stack[top ~ 2].val = stack [|top — 2].val+ stack[top].val; 
top = top ~ 2; } 

五 一 人 

ToT,+F { stack[top — 2].val = stack [top — 2].val x stack [top].val; 
top = top — 2; } 

TOF 

Fo(E) { stack [top — 2].val = stack[top — 1]. val; 
top = top — 2; } 

F > digit : 











图 5-20 在 一 个 自 底 向 上 语法 分 析 栈 中 实现 桌 上 计算 器 


请 注意 , 我 们 省 略 了 针对 栈 中 记录 的 第 一 个 字段 的 操作 步骤 。 这 个 字段 保存 了 LR 状态 或 文 
法 符号 。 如 果 我 们 执行 LR 语法 分 析 过 程 , 语法 分 析 表 将 给 出 每 次 归 约 之 后 的 新 状态 , 见 算法 
4.44。 因 此 , 我 们 可 以 直接 把 这 个 新 状态 放 到 新 的 栈 硕 记录 中 。 5 
5.4.3 产生 式 内 部 带 有 语义 动作 的 SDT 
动作 可 以 放置 在 产生 式 体 中 的 任何 位 置 上 。 当 一 个 动作 左边 的 所 有 符号 都 被 处 理 过 后 , 该 
动作 立刻 执行 。 因 此 , 如 果 我 们 有 一 个 产生 式 BX al Y, 那么 当 我 们 识别 到 X( 如 果 半 是 终结 符 
号 ) 或 者 所 有 从 XX 推导 出 的 终结 符号 (如 果 半 是 非 终结 符号 ) 之 后 , 动作 a 就 会 执行 。 更 准确 
地 讲 ， 
o 如 果 语 法 分 析 过 程 是 自 底 向 上 的 , 那么 我 们 在 XX 的 此 次 出 现 位 于 语法 分 析 栈 的 栈 顶 时 ， 
我 们 立刻 执行 动作 a。 
e 如 果 语 法 分 析 过 程 是 自 顶 向 下 的 , 那么 我 们 在 试图 展开 Y 的 本 次 出 现 ( 如 果 了 是 非 终 结 符 
号 ) 或 者 在 输入 中 检测 Y( 如 果 了 是 终结 符号 ) 之 前 执行 语义 动作 a。 
可 以 在 语法 分 析 过 程 中 实现 的 SDT 包括 后 级 SDT 和 即将 在 5.5 节 中 讨论 的 一 类 SDT, 这 类 
SDT 实现 了 工 属 性 定义 。 不 是 所 有 的 SDT 都 可 以 在 语法 分 析 过 程 中 实现 ,下 面 我 们 就 给 出 一 个 
例子 。 





CEG 作为 一 个 有 问题 的 SDT 的 极端 例子 , 假设 | gn 
”我 们 将 桌 上 计算 器 的 例子 改 成 一 个 可 以 打印 输入 表达 ， 2 LER E,+T 
式 的 前 缀 表示 方式 的 SDT, 而 不 再 对 表达 式 进行 求 值 。 | 4) T { print('#’);} TyF 
新 SDT 的 产生 式 和 动作 显示 在 图 5-21 中 。 E SE a 
遗憾 的 是 , 不 可 能 在 自 顶 向 下 或 自 底 向 上 的 语法 | 7 F > digit { print(digit.lecval; } 














分 析 过 程 中 实现 这 个 SDT, 因为 语法 分 析 程 序 必 须 在 
它 还 不 知道 出 现在 输入 中 的 运算 符号 是 * 还 是 + 的 时 图 5-21 在 语法 分 析 过 程 中 完成 中 绷 到 
候 , 就 执行 打印 这 些 符号 的 操作 。 前 级 翻 详 的 有 问题 的 SDT 
在 产生 式 2 和 4 中 分 别 使 用 标记 非 终 结 符号 M, 和 M4 来 蔡 代 相应 的 动作 , 一 个 移入 - 归 约 
语法 分 析 器 ( 见 4.5.3 节 ) 在 处 理 输入 digit( 比如 3) 的 时 候 会 因为 不 能 确定 是 使 用 Me 归 约 ， 
EHM e A, 还 是 移 人 输入 数字 而 产生 一 个 冲突 。 口 
任何 SDT 都 可 以 按照 下 列 方法 实现 : 
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1) 忽略 语义 动作 , 对 输入 进行 语法 分 析 , 并 产生 一 棵 语法 分 析 树 。 
2) 然后 检查 每 个 内 部 结 点 N, 假设 它 的 产生 式 是 Aca. K a 中 的 各 个 动作 当 作 N 的 附加 子 
结 点 加 入 , 使 得 NN 的 子 结 点 从 左 到 右 和 a 中 的 符号 及 动作 完全 一 致 。 
3) 对 这 标语 法 树 进行 前 序 遍 历 ( 见 2.3.4 节 ), 并 且 当 访问 到 一 个 以 某 个 动作 为 标号 的 结 点 
时 立刻 执行 这 个 动作 。 
比如 , 图 5-22 显示 了 带 有 插入 动作 的 表达 式 3 *5 +4 的 语法 分 析 树 。 如 果 我 们 按照 前 序 次 
序 来 访问 结 点 , 我 们 就 得 到 了 这 个 表达 式 的 ee + * 354, 


IN 
ae 
a 
xX ie 


x F. digit { print(4); } 


{ print( +’); y E 





{ print('*’); = 

digit { print(5); } 
digit iania } 

图 5-22 艇 人 了 动作 的 语法 分 析 树 


5.4.4 从 SDT 中 消除 左 递归 

因为 带 有 左 递归 的 文法 不 能 按照 自 顶 向 下 的 方式 确定 地 进行 语法 分 析 ， 所 以 在 4.3.3 
节 中 介绍 了 左 递归 的 消除 。 当 文法 是 SDT 的 一 部 分 时 , 我 们 还 需要 考虑 如 何 处 理 其 中 的 
动作 。 

首先 考虑 简单 的 情况 ,， 即 我 们 只 需要 关心 一 个 SDT 中 的 动作 的 执行 顺序 的 情况 。 比 如 ,如果 
每 个 动作 只 打印 一 个 字符 串 , 我 们 就 只 关心 这 些 字符 种 的 打印 顺序 。 在 这 种 情况 下 , 可 以 应 用 下 
面 的 原则 完成 这 个 转化 : 

e 当 转 换文 法 的 时 候 , 将 动作 当成 终结 符号 处 理 。 

这 个 原则 基于 下 面 的 思想 : 文法 转换 保持 了 由 文法 生成 的 符号 串 中 终结 符号 的 顺序 。 因 此 ， - 
这 些 动作 在 任何 从 左 到 右 的 语法 分 析 过 程 中 都 按照 相同 的 顺序 执行 ， 不 管 这 个 分 析 是 自 顶 向 下 
的 还 是 自 底 向 上 的 。 

T 技巧 "是 对 两 个 产生 式 

4 一 4a18 È, 

进行 奉 换 。 这 两 个 产生 式 生 成 的 串 包含 一 个 B 和 任意 数量 的 a。 它们 将 被 替换 为 下 面 的 产生 式 。 四 
新 的 产生 式 使 用 了 一 个 新 非 终结 符号 RRR 其余 部分" ) 来 生成 同样 的 串 。 a 


A> BR 
Rak |e 


如 果 B 不 以 A 开头 ,那么 A 就 不 再 有 左 递归 的 产生 式 。 按 照 正则 定义 的 表示 法 ,在 两 组 产生 式 中 ， 
A 都 被 定义 为 B(a) * 。 在 4 3.3 节 中 可 以 看 到 如 何 处 理 A 有 多 个 递归 或 非 递归 产生 式 的 情况 。 
考虑 下 面 的 产生 式 。 它 们 来 自 一 个 将 中 红 表 达 式 翻译 成 后 级 表达 式 的 SDT: 


E > B+T { print('+’); } 
E >» T 
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如 果 我 们 对 应 用 标准 的 左 递 归 消除 转换 ， 左 递归 产生 式 的 余部 为 
a = + T { print('+’); } 
而 B( 即 男 一 个 产生 式 的 体 ) 是 了 。 如 果 我 们 引 和 全 米 表 示 E 的 余部 ,我 们 就 得 到 如 下 的 产生 式 集 
°R 
R 


aN 


> { print('+);} R 
F 
o 

当 一 个 SDD 的 动作 是 计算 属性 的 值 , 而 不 是 仅仅 是 打印 输出 时 , 我 们 必须 更 加 小 心地 考虑 
如 何 消除 文法 中 的 左 递归 。 然 而 , 如 果 这 个 SDD 是 S 属性 的 , 那么 我 们 总 是 可 以 通过 将 计算 属性 
值 的 动作 放 在 新 产生 式 中 的 适当 位 置 上 来 构造 出 一 个 SDT。 

我 们 将 给 出 一 个 通用 的 解决 方案 ,以 解决 只 有 单个 递归 产生 式 、 单 个 非 递归 产生 式 并 且 该 左 
递归 非 终结 符号 只 有 单个 属性 的 情况 。 将 这 个 方案 推广 到 多 个 递归 / 非 递 归 产 生 式 的 情况 并 不 困 
难 , 但 是 写 起 来 非常 麻烦 。 假 设 这 两 个 产生 式 是 : 

A > A, Y {A.a = 9(A).0,Y.y)} 
A => X {Aa= f(X.2)} 


这 里 4.a 是 左 递归 非 终结 符号 4 的 综合 属性 , 而 X 和 了 是 单个 文法 符号 , 分 别 有 综 合 属性 Xx 和 
了 .y。 因 为 这 个 方案 在 递归 的 产生 式 中 用 任意 的 函数 g 来 计算 Ac, 而 在 第 二 个 产生 式 中 用 任意 
函数 了 来 计算 A a 的 值 , 所 以 这 两 个 符号 可 以 代表 由 多 个 文法 符号 组 成 的 串 , 每 个 符号 都 有 自己 
的 属性 。 在 每 种 情况 下 , /和 8& 可 以 把 它们 能 够 访问 的 属性 当 作 它 们 的 参数 ,只 要 这 个 SDD 是 3 
属性 的 。 

我 们 要 把 基础 文法 改 成 





A 一 XR 
R > YRle 


图 5-23 指出 了 在 新 文法 上 的 SDT 必须 做 的 事情 。 在 图 5-23a 中 , 我 们 看 到 的 是 原文 法 之 上 
的 后 级 SDT 的 运行 效果 。 我 们 将 /应 用 一 次 , 该 次 应 用 对 应 于 产生 式 AX 的 使 用 。 然 后 我 们 应 
用 函数 g, 应 用 的 次 数 和 我 们 使 用 产生 式 .4--*47 的 次 数 一 样 。 因 为 民生 成 了 了 的 一 个 余部 , 它 的 
翻译 依赖 于 它 左 边 的 串 ， 即 一 个 形 如 XYY--Y 的 串 。 对 产生 式 R->YR 的 每 次 使 用 都 导致 对 g 的 一 
RAM. HFR, 我 们 使 用 一 个 继承 属性 R. i 来 累计 从 A. a 的 值 开始 不 断 应 用 g 所 得 到 的 结果 。 


A.a = 9(9(f(X.2), ¥i-y), Yay) A 
J 


Aa =g f(X) Yy Y X Ri = f(X2) 
A.a = f(X.2) Yı Yı Ri = g(f(X.2),Y1.y) 
| Y2” Ri= g(9(f(X.2), Yi.y), You) 
a) b) | 


图 5-23 ”消除 一 个 后 级 SDT 中 的 左 递归 


除 此 之 外 ,RR 还 有 一 个 没有 在 图 5-23 中 显示 的 综合 属性 R.s。 当 RR 不 再 生成 文法 符号 Y 时 才 
开始 计算 这 个 属性 的 值 , 这 个 时 间 点 是 以 产生 式 Roe 的 使 用 为 标志 的 。 然 后 Rs 沿 着 树 向 上 拷 
由 ,最 后 它 就 可 以 变 成 对 应 于 整个 表达 式 XYY- Y W A. a 的 值 。 从 4 生成 XYY 的 情况 显示 在 图 
5-23 中 , 我 们 看 到 在 图 5-23a 中 的 根 结 点 上 的 A. a 的 值 使 用 了 两 次 g, 而 在 图 5-23b 的 底部 的 Ri 
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也 使 用 了 两 次 g, 而 正 是 这 个 结 点 上 的 R s KERER EN. 
为 了 完成 这 个 翻译 , 我 们 使 用 下 列 SDT: 
f A > X {Ri=f(X.zx)}) R {Aa = R.s} 
R > Y {Rai=g(RijYy)} Ri {R.s = Ri.s} 
R > ¢ {R.s = Ri} 


请 注意 , 继承 属性 R i 在 产生 式 体 中 RR 的 一 次 使 用 之 前 完成 求 值 , 而 综合 属性 4.a AR. s FE 
产生 式 的 结尾 完成 求 值 。 因 此 , 计算 这 些 属性 时 需要 的 任何 值 都 已 经 在 左边 计算 完成 , 变 成 了 可 
用 的 值 。 

5.4.5 上 属性 定义 的 SDT 

在 5.4.1 节 , 我 们 将 S 属性 的 SDD 转换 成 为 后 缀 SDT, 它 的 动作 位 于 产生 式 的 右 端 。 只 要 基 
础 文法 是 LR 的 ,后缀 SDT 就 可 以 按照 自 底 向 上 的 方式 进行 语法 分 析 和 翻译 。 

现在 , 我们 考虑 更 加 一 般 化 的 情况 , 即 工 属性 的 SDD。 我 们 假设 基础 文法 将 以 自 顶 向 下 的 方 
式 进行 语法 分 析 , 因为 如 果 不 是 这 样 , 那么 翻译 过 程 常常 无 法 和 一 个 LL 或 LR 语法 分 析 器 一 起 完 
成 。 对 于 任何 文法 ,我们 只 需要 将 动作 附加 到 一 棵 语法 分 析 树 中 , 并 在 对 这 棵 树 进 行 前 序 遍 历时 
执行 这 些 动作 , 便 可 以 实现 下 面 的 技术 。 

将 一 个 工 属性 的 SDD 转换 为 一 个 SDT 的 规则 如 下 : 

1) 把 计算 某 个 非 终结 符号 4 的 继承 属性 的 动作 插入 到 产生 式 体 中 紧 靠 在 4 的 本 次 出 现 之 前 
的 位 置 上 。 如 果 4 的 多 个 继承 属性 以 无 环 的 方式 相互 依赖 ,就 需要 对 这 些 属性 的 求 值 动作 进行 
排序 , 以 便 先 计 算 需 要 的 属性 。 

2) 将 计算 一 个 产生 式 头 的 综合 属性 的 动作 放置 在 这 个 产生 式 体 的 最 右 端 。 

我 们 将 使 用 两 个 例子 来 说 明 这 些 原则 。 第 一 个 例子 是 关于 排版 的 。 它 说 明了 如 何 将 编译 技 
术 应 用 于 其 他 的 语言 处 理应 用 , 编译 技术 的 应 用 范围 并 不 限于 我 们 通常 认为 的 程序 设计 语言 。 
第 二 个 例子 是 关于 一 个 典型 程序 设计 语言 构造 的 中 间 代 码 生 成 的 , 这 个 构造 是 菜 种 形式 的 while 
语句 。 

DEE 这 个 例子 来 自 于 数学 公式 排版 语言 。Eqn 是 这 种 语言 的 早期 例子 ,来 自 Eqn 的 思想 仍 
然 可 以 在 Tex 排版 系统 中 找到 , 本 书 就 是 用 Tex 排版 系统 排版 的 。 

我 们 将 关注 定义 下 标 、 下 标的 下 标 等 排版 能 力 ， 而 忽略 了 上 标 、 杰 加 的 分 数 以 及 其 他 数学 功 
能 。 在 Eqn 语言 中 , 人 们 可 以 使 用 a sub i sub j 来 设 定 表达 式 @, 。 一 个 简单 的 boxes( 即 由 一 个 $ 
方 框 括 起 来 的 文本 元 素 ) MIKE: 

B-+B, B,\B,subB, | (B, ) | text 

对 应 于 这 四 个 产生 式 , 一 个 方 框 可 以 是 下 列 之 一 : 

1) 两 个 并 列 的 方 框 , 其 中 第 一 个 方 框 B 在 另 一 个 方 框 B。 的 左边 。 

2) 一 个 方 框 和 一 个 下 标 方 框 。 第 二 个 方 框 的 尺寸 较 小 且 位 置 较 低 , 位 于 第 一 个 方 框 的 右边 。 

3) 一 个 用 括号 括 起 来 的 方 框 , 用 于 方 框 和 下 标的 分 组 。Eqn 和 Tex 都 使 用 花 括号 进行 分 组 ， 
但 是 我 们 将 使 用 通常 的 圆 括号 来 分 组 ， 以 避免 和 SDT 动作 两 边 的 括号 混淆 。 

4) 一 个 文本 串 , 也 就 是 任何 字符 串 。 

这 个 文法 是 二 义 性 的 , 但 是 如 果 我 们 令 下 标 和 并 列 关 系 都 是 右 结合 的 ,并 且 令 sub 的 优先 级 
高 于 并 列 ， 那么 我 们 仍然 可 以 使 用 它 来 完成 自 底 向 上 的 语法 分 析 。 

表达 式 的 排版 过 程 就 是 由 较 小 的 方 框 构造 出 较 大 的 方 框 的 过 程 。 在 图 5-24 中 ,Ei 的 方 杠 和 
height 将 被 并 列 放置 形成 方 框 E1. height, W E, 的 左边 方 框 本 身 又 是 从 的 方 框 和 下 标 1 的 方 
框 构造 得 到 的 。 下 标 1 的 处 理 方法 是 将 它 的 方 框 缩小 大 约 30% , 并 放 在 较 低 的 位 置 上 , 然后 把 它 
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Hite E TEZE. BARIKI . height 作为 一 个 文本 串 进行 处 理 , 但 它 的 方 框 中 的 长 方形 会 
,说明 它 是 如 何 从 各 个 字母 对 应 的 方 框 构造 得 到 的 。 

I m se eae 

| ho height 

eee jo bean 





图 5-24 ”从 较 小 的 方 框 构 造 较 大 的 方 框 


在 这 个 例子 中 , 我 们 只 考虑 这 些 方 框 的 垂直 方向 的 几何 性 质 。 水 平方 向 的 几何 性 质 ， 即 方 杠 
的 宽度 ， 也 很 有 意思 ， 当 不 同 字符 具有 不 同 宽度 时 更 是 如 此 。 可 能 看 起 来 不 是 那么 明显 , 但 是 图 
5.24 中 的 各 个 字符 确实 具有 不 同 的 宽度 。 

“和 这 些 方 框 的 垂直 方向 几何 性 质 相 关 的 值 如 下 : 

1) 字体 大 小 (point size) 。 它 被 用 于 在 一 个 方 框 中 设置 文本 。 我 们 将 假设 不 在 下 标 中 的 字符 
被 设置 为 10 点 , 也 就 是 一 般 书 籍 的 字体 大 小 。 进 一 步 , 我 们 假设 如 果 一 个 方 框 的 字体 大 小 是 p， 
那么 它 的 下 标 方 框 的 字体 大 小 就 是 0. 7p。 继 承 属性 B. ps RRR B 的 字体 大 小 点 数 。 这 个 属性 必 
须 是 继承 属性 ， 因 为 一 个 给 定 的 块 的 上 下 文 决定 了 这 个 块 在 哪个 下 标 层 次 ,从 而 决定 需要 缩小 
少 。 

2) 每 个 方 框 有 一 个 基线 (baseline) , 它 是 对 应 于 文本 行 的 底部 的 垂直 位 置 , 它 不 考虑 像 g 这 
样 的 伸展 到 正常 基线 之 下 的 字符 。 在 图 5-24 中 , 点 虚线 就 表示 了 方 框 户 、 height 以 及 整个 表达 式 
的 基线 。 包 含 了 下 标 1 工 的 方 框 的 基线 经 过 了 调整 , 以 便 把 这 个 下 标 放 在 较 低位 置 。 

3) 每 个 方 框 有 一 个 高 度 (height) , 它 是 从 方 框 顶部 到 方 框 基线 的 距离 。 综 合 属性 B. ht 给 出 





了 方 框 8 的 高 度 。 
4) 每 个 方 框 有 一 个 深度 (depth) , 它 是 从 基线 到 达 方 框 底部 的 距离 。 综 合 属性 B. dp 给 出 了 
方 框 B 的 深度 。 


图 5-25 中 的 SDD 给 出 了 计算 字体 大 小 、 高 度 和 深度 的 规则 。 产 生 式 1 的 功能 是 把 初始 值 10 
RZS B. ps。 | 








产生 式 语义 规则 


1) S3B B.ps=10 
2) BoB, By By.ps = B.ps 
B2.ps= B.ps 


B.ht = max(Bi.ht, B2.ht) 
B.dp = max(Bi.dp, B2.dp) 


3) B > Bi sub By | Bı.ps = B.ps 

Bo.ps = 0.7 x B.ps 

B.ht = max(B)-ht, Bo-ht — 0.25 x B.ps) 
B.dp = max(B,.dp, By.dp + 0.25 x B.ps) 











4) B>(B)} Bi.ps= B.ps 
B.ht= Bi.ht 
B.dp = Bi.dp 
5) B- text B.ht = getHt(B.ps, text.lerval) 











B.dp = getDp (B.ps, text.lexval) 





图 5-25 方 框 排 版 的 SDD 
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产生 式 2 处 理 并 列 的 情况 。 字 体 大 小 被 沿 着 语法 分 析 树 向 下 拷贝 , 也 就 是 说 , 一 个 方 框 的 两 
个 子 方 框 从 这 个 较 大 的 方 框 中 继承 了 同样 的 字体 大 小 点 数 。 高 度 和 深度 是 沿 着 语法 分 析 树 向 上 
计算 的 , 总 是 取 两 者 的 最 大 值 。 也 就 是 说 , 大 方 框 的 高 度 是 它 的 两 个 组 成 部 分 的 高 度 的 最 大 值 ， 
深度 也 按照 类 似 的 方法 计算 。  . 

产生 式 3 处理 下 标 , 它 是 最 复杂 的 。 在 这 个 简化 了 的 例子 中 , 我 们 假设 一 个 下 标 方 框 的 字体 
大 小 是 它 的 父 方 框 的 大 小 的 70% 。 实 际 情况 会 更 加 复杂 , 因为 下 标 不 可 能 无 限 缩小 。 在 实践 中 ， 
在 几 层 下 标 之 后 , 下 标的 大 小 就 几乎 不 再 缩小 。 另 外 我 们 还 假设 一 个 下 标 方 框 的 基线 向 下 移动 
了 父 方 框 的 字体 点 数 大 小 的 25%, 同样, 实际 情况 要 更 加 复杂 。 

产生 式 4 在 使 用 括号 的 时 候 正确 地 拷贝 各 个 属性 。 最 后 , 产生 式 5 处 理 表示 文本 方 框 的 叶子 
结 点 。 在 这 里 , 实际 情况 也 是 很 复杂 的 ， 因 此 我 们 只 显示 了 两 个 未 定义 的 函数 geht 和 getDp。 它 
们 检查 各 个 字体 的 表格 ,以 确定 文本 串 中 的 全 部 字符 的 最 大 高 度 和 最 大 深度 。 我 们 假设 这 个 文 
本 串 中 的 字符 是 由 终结 符号 text 的 属性 lexval 提供 的 。 

最 后 一 个 任务 是 按照 图 5-25 中 处 理工 属性 SDD 的 规则 , 将 这 个 SDD 转换 为 SDT。 正 确 的 
SDT 显示 在 图 5-26 中 。 因 为 产生 式 的 体 比较 长 , 为 了 增加 可 读 性 , 我 们 把 它们 分 割 到 多 行 中 , 并 








把 动作 对 齐 排列 。 因 此 , 产生 式 体 包 含 了 到 下 一 个 产生 式 的 头 为 止 的 多 行内 容 。 D 
产生 式 语义 动作 
i 5 一 { B.ps= 10; } 
B 
2) B > {Bi.ps = B.ps; } 
Bı { Bo.ps = B.ps; } 
By { B.ht= max(B,.ht, By.ht); 
B.dp = max(B,.dp, B2.dp); } 
3) Bo {Bi.ps = B.ps; } 
Bı sub {Bo.ps= 0.7 x B.ps; } 
Bo { B.ht= max(B,.ht, Bo.ht— 0.25 x B.ps); 





B.dp = max( Bi.dp, Bo.dp + 0.25 x B.ps); } 


4) Bo ( {Bi.ps= B.ps; } 
B, ) { B.ht= Bi.ht; 
B.dp = Bi.dp;} 
5) B > text { B.ht= getHi(B.ps, text.lerval); 
B.dp = getDp(B.ps, text.lezval); } 








图 5-26 方 框 排版 的 SDT 


我 们 的 下 一 个 例子 是 考虑 一 个 简单 的 while 语句 , 考虑 如 何 为 这 种 类 型 的 语句 生成 中 间 1 
码 。 中 间 代 码 将 被 当 作 一 个 值 为 字符 串 的 属性 。 稍 后 我 们 将 探究 一 些 高 效 的 技术 。 这 些 技术 在 
我 们 进行 语法 分 析 的 时 候 顺序 输出 一 个 取 值 为 字符 串 的 属性 的 各 个 部 分 ,从 而 避免 了 通过 长 字 
符 牛 的 拷贝 来 构造 出 更 长 的 字符 串 。 这 个 技术 在 例 5. 17 中 已 经 介绍 过 。 在 那个 例子 中 , 我们 大 
“ 边 扫描 边 生成 "的 方式 生成 了 一 个 中 组 表达 式 的 后 级 形式 ， 而 不 是 把 表达 式 的 后 级 形式 当 作 一 
个 属性 来 计算 。 然 而 , 在 我 们 第 一 次 表示 中 间 代 码 生 成 时 , 我 们 通过 字符 串 的 连接 来 创建 一 个 信 
为 字符 串 的 属性 。 
DED EFT, 我 们 只 需要 一 个 产生 式 : 

S—while(C)S, 
这 里 , S 是 生成 各 种 语句 的 非 终结 符号 , 我 们 假设 这 些 语 句 包括 这 语句 、 赋 值 语句 和 其 他 类 
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语句 。 在 这 个 例子 中 ，C 表示 一 个 条 件 表 达 式 一 一 一 个 值 为 真 或 俱 的 布尔 表达 式 。 

在 这 个 关于 语句 控制 流 的 例子 中 , 我 们 只 需要 生成 多 个 标号 。 我 们 假设 其 他 的 中 间 代 码 指令 都 由 
这 个 SDT 的 未 显示 部 分 生成 。 更 明确 地 讲 , 我 们 生成 显 式 的 形 如 label 工 的 指令 , 其 中 工 是 一 个 标识 
符 。 这 个 指令 表明 后 一 条 指令 的 标号 是 工 。 我 们 假 疫 中 间 代码 和 2. 8.4 节 中 介绍 的 代码 类 似 。 

这 个 while 语句 的 含义 是 首先 对 条 件 表达 式 C 求 值 。 如 果 它 为 真 , 控制 就 转向 S, 的 代码 的 
开始 处 。 如 果 C 的 值 为 假 , 那么 控制 就 转向 跟 在 这 个 while 语句 的 代码 之 后 的 代码 。 我 们 必须 设 
aS, 的 代码 , 使 得 它 在 结束 的 时 候 能 够 跳 转 到 这 个 while 语句 的 代码 的 开始 处 。 图 5-27 没有 显 
示 出 跳 转 到 对 C 求 值 的 代码 的 开始 处 的 指令 。 

我 们 使 用 下 面 的 属性 来 生成 正确 的 中 间 代 码 ; 

1) 继承 属性 S. next 是 必须 在 S 执行 结束 之 后 执行 的 代码 的 开始 处 的 标号 。 

2) 综合 属性 S. code 是 中 间 代 码 的 序列 , 它 实现 了 语句 S, 并 在 最 后 有 一 条 跳 转 到 S. next 的 
指令 。 

”3) 继承 属性 C. true 是 必须 在 C 为 真 时 执行 的 代码 的 开始 处 的 标号 。 

4) 继承 属性 C. false 是 必须 在 C 为 假 时 执行 的 代码 的 开始 处 的 标号 。 

5) 综合 属性 C. code 是 一 个 中 间 代 码 的 序列 , 它 实现 了 条 件 表达 式 C, 并 根据 C 的 值 为 真 或 
假 跳 转 到 C. true 或 者 C. false。 

计算 while 语句 的 这 些 属 性 的 SDD 显示 在 图 5-27 中 。 有 几 个 要 点 需要 解释 一 下 ; 











S— while(C)S, L1=new(); 
L2 = new(); 
Si.nert = Ll; 
C.false = Snert; 
C.true = L2; 
S.code = label || L1 || C.code || label || L2 || Sr:code 





图 5-27 while 语句 的 SDD 


© 函数 new 生成 了 新 的 标号 。 

e 变量 LI #12 存放 了 在 代码 中 需要 的 标号 。L1l 表示 这 个 while 语句 的 代码 的 开始 处 , 我 们 
必须 安排 Sy 在 执行 完毕 之 后 跳 转 到 这 里 。 这 就 是 我 们 把 S. nex 设置 为 L1 KRA, L2 
是 51 的 代码 的 开始 处 , CERT C true 的 值 ， 因 为 在 C 为 真 时 会 跳 转 到 那里 。 

o 请 注意 C. false 被 设置 为 8 next,， 因 为 当 条 件 为 假 时 ， 就 会 执行 $ 的 代码 之 后 的 代码 。 

© 我 们 使 用 | 作为 连接 各 个 中 间 代 码 片 段 的 符号 。 因 此 ，S. code 的 值 的 以 标号 Ll 开始 ， 然 
后 是 条 件 表达 式 C 的 代码 , 然后 是 男 一 个 标号 L2, 然后 是 51 的 代码 。 

这 个 SDD 是 工 属性 的 。 当 我 们 把 它 转换 为 SDT 时 , 还 需要 考虑 如 何 处 理 标号 Ll 和 及 ,它们 
是 变量 而 不 是 属性 。 如 果 我 们 把 语义 动作 当 作 哑 非 终结 符号 来 处 理 , 那么 这 样 的 变量 可 以 当 作 
哑 非 终结 符号 的 综合 属性 来 处 理 。 因 为 [1 和 也 不 依赖 于 其 他 属性 ， 它 们 可 以 被 分 配 到 产生 式 的 
第 一 个 语义 动作 中 。 实 现 这 个 工 属性 定义 的 带 有 内 垦 请 义 动作 的 SDT 显示 在 图 5-28 中 。 口 








S while( { L1= new(); L2 = new(); C.false = S.neat; C.true = L2; } | 
C) { S1.nezt = L1; } 
Sy { S.code = label || L1 || C.code || label || L2 || S).code; } 
| 





图 5-28 while 语句 的 SDT 
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5.4.6 5.4 节 的 练习 

练习 5. 4. 1: 我 们 在 5.4.2 节 中 提 到 可 能 根据 语法 分 析 栈 中 的 LR 状态 来 推导 出 这 个 状态 表 
示 了 什么 文法 符号 。 我 们 如 何 推导 出 这 个 信息 ? 

练习 5.4.2: 改写 下 面 的 SDT: 


A= A {a} B| AB {b}|0 
B>B {c} A{ BA {d} | 1 


使 得 基础 文法 变 成 非 左 递归 的 。 这 里 , a、b、c 和 和 4d 是 语义 动作 , 0 和 1 是 终结 符号 。 
| 练习 5. 4.3: 下 面 的 SDT 计算 了 一 个 由 0 和 1 组 成 的 串 的 值 。 它 把 输入 的 符号 串 当 作 按 照 
正二 进 制 数 来 解释 。 
; B > Bi0{B.val=2x By.val} 


| B, 1{B.val = 2 x Bi.val + 1} 
| 1 {B.val = 1} 


改写 这 个 SDT, 使 得 基础 文法 不 再 是 左 递归 的 , ERA A h A A E H A YB. val 
的 值 。 

! 练习 5.4.4: 为 下 面 的 产生 式 写 出 一 个 和 例 S. 10 类 似 的 工 属 性 SDD。 这 里 的 每 个 产生 式 
表示 一 个 常见 的 C 语言 中 那样 的 控制 流 结构 。 你 可 能 需要 生成 一 个 三 地 址 语句 来 跳 转 到 某 个 标 
SL, 此 时 你 可 以 生成 语句 goto Lo 

1) S + if (C) S else Sy 

2) S -do Sı while (C ) 

3) S > L'Y; L + LSle 
请 注意 , 列表 中 的 任何 语句 都 可 能 包含 一 条 从 它 的 内 部 跳 转 到 下 一 个 语句 的 跳 转 指 令 , 因此 简单 
地 为 各 个 语句 按 顺 序 生成 代码 是 不 够 的 。 

练习 5. 4.5: 按照 例 3. 19 的 方法 , 把 在 练习 5.4.4 中 得 到 的 各 个 SDD 转换 成 一 个 SDT。 

练习 5. 4. 6: 修改 图 5-25 中 的 SDD, 使 它 包含 一 个 综合 属性 B. le, 即 一 个 方 框 的 长 度 。 两 个 
方 框 并 列 后 得 到 的 方 框 的 长 度 是 这 两 个 方 框 的 长 度 和 。 然 后 把 你 的 新 规则 加 入 到 图 5-26 中 SDT 
的 合适 位 置 上 。 

练习 5.4.7: 修改 图 5-25 中 的 SDD, 使 得 它 包含 上 标 , 用 方 框 之 间 的 运算 符 sup 表示 。 如 果 
方 框 B, EDIE B, 的 一 个 上 标 , 那么 将 B, 的 基线 放 在 B 的 基线 上 方 , 两 条 基线 的 距离 是 0.6 乘 
以 中 的 大 小 。 把 新 的 产生 式 和 规则 加 和 到 网 5-26 的 SDT 中 去 。 


5.5 实现 L 属性 的 SDD 


因为 很 多 翻译 应 用 可 以 用 工 属性 定义 来 解决 ,所 以 我 们 将 在 这 一 节 中 详细 地 考虑 它们 的 实 
现 。 下 面 的 方法 通过 遍历 语法 分 析 树 来 完成 翻译 工作 。 

1) 建立 语法 分 析 树 并 注释 。 这 个 方法 对 于 任何 非 循 环 定义 的 SDD 都 有 效 。 我 们 已 经 在 
5.1.2 节 中 介绍 了 注释 语法 分 析 树 。 | 

2) 构造 语法 分 析 树 ， 加 入 动作 ,并 按照 前 序 顺 序 执行 这 些 动 作 。 这 个 方法 可 以 处 理 任何 L 
属性 定义 。 我 们 在 5.4.5 节 中 讨论 了 如 何 把 一 个 工 属 性 SDD 转变 成 为 SDT, 还 特别 讨论 了 如 何 ” 
根据 这 样 的 SDD 的 语义 规则 把 语义 动作 嵌 人 到 产生 式 中 。 

在 这 一 节 , 我 们 讨论 下 面 的 在 语法 分 析 过 程 中 进行 翻译 的 方法 : 3 

3) 使 用 一 个 递归 下 降 的 语法 分 析 器 ， 它 为 每 个 非 终结 符号 都 建立 一 个 函数 。 对 应 于 非 终结 © 
符号 4 的 函数 以 参数 的 方式 接收 4 的 继承 属性 , 并 返回 4 的 综合 属性 。 
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4) 使 用 一 个 递归 下 降 的 语法 分 析 器 ， 以 边 扫 描 边 生成 的 方式 生成 代码 。 

5) 与 LL 语法 分 析 器 结合 , 实现 一 个 SDT。 属 性 的 值 存放 在 语法 分 析 栈 中 ,而 各 个 规则 从 栈 
中 的 已 知 位 置 获取 需要 的 属性 值 。 

6) 与 LR 语法 分 析 器 结合 ,实现 一 个 SDT。 这 个 方法 会 让 人 觉得 惊讶 , 因为 一 个 工 属性 SDD 
的 SDT 通常 有 一 些 动 作 位 于 产生 式 的 中 间 ， 而 在 一 个 LR 语法 分 析 过 程 中 , 我 们 只 有 在 构造 出 一 
个 产生 式 体 的 全 部 符号 之 后 才能 肯定 我 们 确实 可 以 使 用 这 个 产生 式 。 然 而 , 我 们 将 看 到 ， 如果 基 
础 文法 是 LL 的, 我 们 总 是 可 以 按照 自 底 向 上 的 方式 来 处 理 语法 分 析 和 翻译 过 程 。 

5.5.1 在 递归 下 降 语法 分 析 过 程 中 进行 翻译 

4.4.1 节 讨 论 过 , 一 个 递归 下 降 的 语法 分 析 器 对 每 个 非 终结 符号 4 都 有 一 个 函数 4。 我 们 可 
以 按照 如 下 方法 把 这 个 语法 分 析 器 扩展 为 一 个 翻译 吉 : 

1) 函数 4 的 参数 是 非 终结 符号 A 的 继承 属性 。 

2) RÆ A 的 返回 值 是 非 终结 符号 4 的 综合 属性 的 集合 。 

FE PRAY A 的 函数 体 中 , 我 们 要 进行 语法 分 析 并 处 理 属性 : 

1) 决定 用 哪 一 个 产生 式 来 展开 4。 

(2) 当 需 要 读 人 一 个 终结 符号 时 , 在 输入 中 检查 这 些 符 号 是 否 出 现 。 我 们 假设 分 析 过 程 不 需 
要 进行 回溯 , 但 是 只 要 在 出 现 语法 错误 时 恢复 输入 位 置 ,就 可 以 把 这 个 方法 扩展 到 带 回溯 的 递归 
下 降 语法 分 析 技术 , 见 4. 4.1 节 中 的 讨论 。 

3) 在 局 部 变量 中 保存 所 有 必要 的 属性 值 , 这 些 值 将 用 于 计算 产生 式 体 中 非 终结 符号 的 继承 
RE, 或 产生 式 头 部 的 非 终结 符号 的 综合 属性 。 

4) 调用 对 应 于 被 选 定 产 生 式 体 中 的 非 终结 符号 的 函数 , 向 它们 提供 正确 的 参数 。 因 为 基础 
的 SDD Æ L IRER, 所 以 我 们 必然 已 经 计算 出 了 这 些 属 性 并 且 把 它们 存放 到 了 局 部 变量 中 。 

让 我 们 考虑 例 5. 19 while 语句 的 SDD 和 SDT。 图 5-29 显示 了 函数 S 的 相关 部 分 的 








伪 代 码 说 明 。 
我 们 显示 的 这 个 函数 5 需要 存储 并 返回 很 长 的 字符 串 。 在 实践 中 , 更 有 效率 的 做 法 是 让 像 5 


和 C 这 样 的 函数 返回 一 个 指针 , 指向 表示 这 些 字 符 串 的 记录 。 那 么 , BS 中 的 返回 语句 将 不 会 
真 的 把 各 个 组 成 部 分 连接 起 来 , 而 是 构造 出 一 个 记录 或 记录 树 。 这 个 记录 或 记录 树 表示 了 将 
Scode, Ccode, 标号 Ll Fil L2 以 及 文字 串 ” Label ”的 两 次 出 现 全 部 连接 起 来 而 得 到 的 串 。 口 
string S(label nert) { 

string Scode, Ceode; /* FF) (USA ELAS VAR aE EE * / 


label L1, L2; /* 局 部 标号 */ 
if ( 当前 输入 == 词法 单元 while ) { 











读 取 输入 ; 
检查 “(' 是 下 一 个 输入 符号 ,并 恋 取 输 入 ; 
L1 = new(); 

L2 = new(); 





Ceode = C(next, L2); 

检查 Y 是 下 一 个 输入 符号 ， 并 读 取 输入 ; 

Scode = S(L1); 

return("label" || L1 || Ccode || "label" || L2 || Scode); 


} 
else /* 其 他 语句 类 型 */ 








图 5-29 用 一 个 递归 下 降 语法 分 析 器 实现 while 语句 的 翻译 
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A32 现在 我 们 将 处 理 图 5-26 中 用 于 方 框 排 版 的 SDT。 我 们 首先 处 理 语法 分 析 问 题 , 因为 
图 5-26 中 的 基础 文法 是 二 义 性 的 。 下 面 经 过 转换 的 文法 使 得 并 列 运算 和 下 标 运算 都 是 右 结 合 
的 ,而 sub 的 优先 级 高 于 并 列 : 

> B 

zr BolT 


> FsubT, | F 
=> (B) | text 


引入 两 个 非 终 结 符号 了 和 FF 的 灵感 来 自 于 表达 式 中 的 项 和 因子 。 这 里 ,由 玉生 成 的 一 个 “ 因 
子 " 要 么 是 一 个 括号 中 的 方 框 , 要么 是 一 个 文本 串 。 由 了 生成 的 一 个 “项 "是 一 个 带 有 一 系列 下 标 
的 “因子 ”, 而 由 8 生成 的 一 个 方 框 是 一 个 并 列 的 “项 ”的 序列 。 

TAF OREM B 的 属性 一 样 , 因为 新 的 非 终 结 符号 也 表示 方 框 。 引 入 它们 的 目的 仅仅 是 为 
了 帮助 进行 语法 分 析 。 因 此 , 和 下 都 有 一 个 继承 属性 ps 和 综合 属性 ht 及 dp。 它 们 的 语义 动作 
可 以 从 图 5-26 的 SDT 中 修改 得 到 。 

这 个 文法 还 不 可 以 直接 进行 自 顶 向 下 的 语法 分 析 , 因为 B、7 的 产生 式 都 有 相同 的 前 级 。 比 
W, 考虑 了。 一 个 自 顶 向 下 的 语法 分 析 器 不 能 仅 在 输入 中 向 前 看 一 个 符号 就 在 了 的 两 个 产生 式 间 
WERE. PEHE, 我 们 可 以 使 用 4. 3.4 节 中 讨论 的 提取 左 公 因 子 的 方法 , 使 得 这 个 文法 可 以 
进行 自 顶 向 下 语法 分 析 。 处 理 SDT 时 , 公共 前 缀 的 概念 也 被 应 用 到 语义 动作 中 。7 的 两 个 产生 式 
都 以 非 终结 符号 FAR, 这 个 符号 从 7 了 中 继承 了 属性 ps。 

图 5-30 中 7(ps) 的 伪 代 码 中 加 入 了 Fps) 的 代码 。 对 产生 式 7 一 F sub T! 下 应 用 提取 左 公 
因子 的 操作 之 后 , 只 需要 对 玉 调 用 一 次 。 这 个 伪 代 码 显示 了 将 该 次 调用 替换 为 的 代码 之 后 的 
结果 。 


YUU 





(float, float) T (float ps) { 
float hl, h2, dl, d2; /* 用 于 存放 高 度 和 深度 的 局 部 变量 */ 
/* F(ps) 代码 开始 */ 
这 (当前 输入 == '(') { 
读 取 下 一 个 输入 ; 
(hl,dl) = B(ps); 
if (当前 输入 != 小 ) 语 法 错误 : HAE 'Y; 
读 取 下 一 个 输入 ; 


} 
else if ( 当前 输入 == text ) { 
S t 等 于 词法 值 text. lexval ; 
读 取 下 一 个 输入 ; 
hl = getHt(ps, t); 
dl = getDp(ps, t); 


else 语 法 错误 : 期 待 text MH '('; 
/* F(ps) 代码 结束 */ 
这 (当前 输入 == sub ) { 
读 取 下 一 个 输入 ; 
(h2,d2) = T(0.7 * ps); 
return (max(h1, h2 — 0.25 + ps), max(d1,d2 + 0.25 + ps)); 





return (hl, d1); 











图 5-30 递归 下 降 的 方 框 排 板 


B 的 消 数 以 7T(10.0) 的 方式 调用 函数 7, 我 们 没有 在 这 里 显示 这 个 调用 。 该 次 调用 返回 一 个 
二 元 组 , 包括 由 非 终 结 符号 了 生成 的 方 框 的 高 度 和 深度 。 在 实践 中 , 它 将 返回 一 个 包含 高 度 和 深 
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度 的 记录 。 
函数 了 首先 检查 输入 是 否 为 左 括号 。 如 果 是 ， 它 就 必须 处 理 产 生 式 F--*(B)。 它 保存 了 括号 
中 中 返回 的 任何 值 , 但 是 如 果 如 后 面 没有 跟着 一 个 右 括 号 , 那么 就 存在 语法 错误 。 处 理 这 个 语法 
错误 的 方式 没有 在 这 里 显示 。 
否则 , 如 果 当 前 的 输入 是 text, 那么 函数 了 使 用 gel 正和 eetDp 来 确定 这 个 文本 的 高 度 和 
深度 。 
然后 ,函数 了 确定 下 一 个 方 框 是 否 为 一 个 下 标 , 如果 是 就 调整 point size。 我 们 使 用 和 图 5-26 
的 产生 式 B>B sub B 关联 的 语义 动作 来 处 理 较 大 方 框 的 高 度 和 深度 。 否 则 , 我 们 直接 返回 下 所 
返回 的 值 : (hi, dl). 口 
5.5.2 ” 边 扫 描 边 生成 代码 | 
如 例 5. 20 所 示 , 使 用 属性 来 表示 代码 并 构造 出 很 长 的 串 不 能 满足 我 们 的 要 求 ， 原因 是 多 方 
面 的 ， 比 如 找 贝 和 移动 这 些 串 字符 时 需要 很 长 的 时 间 。 在 通常 情况 下 ， 比 如 在 我 们 的 代码 生成 例 
PH, 我 们 可 以 通过 执行 一 个 SDT 中 的 语义 动作 , 逐步 把 各 个 代码 片段 添加 到 一 个 数组 或 输出 文 
件 中 。 要 保证 这 项 技术 能 够 正确 应 用 ,下 列 要 素 必 不 可 少 : i 
1) 存在 一 个 (一 个 或 多 个 非 终结 符号 的 ) 主 属性 。 为 方便 起 见 , 我 们 假设 主 属性 都 以 字符 串 
为 值 。 在 例 5. 20 H, 属性 S. code 和 C. code EERE, 而 其 他 属性 不 是 主 属性 。 
2) 主 属性 是 综合 属性 。 
3) 对 主 属性 求 值 的 规则 保证 : 
OD 主 属性 是 将 相关 产生 式 体 中 的 非 终 结 符号 的 主 属性 值 连接 起 来 得 到 的 。 连 接 时 也 可 能 包 
括 其 他 非 主 属性 的 元 素 ， 比 如 字符 串 labe 和 标号 LI 及 [2 的 值 。 
@ 各 个 非 终结 符号 的 主 属性 值 在 连接 运算 中 出 现 的 顺序 和 这 些 非 终 结 符号 在 产生 式 体 中 的 
出 现 顺 序 相同 。 
上 面 这 些 条 件 使 得 我 们 在 构造 主 属性 时 只 需要 在 适当 的 时 候 发 出 这 个 连接 运算 中 的 非 主 属 
性 元 素 。 我 们 可 以 依靠 对 一 个 产生 式 体 中 的 非 终结 符号 的 对 应 函数 的 递归 调用 ,以 增 量 方式 生 
成 它们 的 主 属性 。 : 
DRA 我 们 可 以 修改 图 5-29 中 的 函数 , 使 得 它 生成 主 属性 5. code 的 各 个 元 素 ， 而 不 是 把 它 
们 保存 起 来 ， 再 连接 得 到 S. code 的 一 个 返 回 值 。 经 过 修改 的 函数 S 显示 在 图 5-31 中 。 
f void S(label nezt) { 
label Li, L2; /* 局 部 标号 */ 
if ( 当前 输入 == 词法 单元 while ) { 
读 取 输 入 ; 
检查 “(' 是 下 一 个 输入 符号 , 并 读 取 输 人 ; 
Li = neu); 
L2 = new(); 
print("labe1", L1); 
C(nezt, L2); 
检查 “) 是 下 一 个 输入 符号 , 并 读 取 输 入 ; 


print("label", L2); 
S(L1); 














} 
else /* 其 他 语句 类 型 */ 





图 5-31 while 语句 的 on-the-fly 的 递归 下 降 代码 生成 
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在 图 5-31 中 , SAIC 现在 不 返回 任何 值 , 因为 它们 唯一 的 综合 属性 是 通过 打印 生成 的 。 而 且 
这 些 打印 语句 的 位 置 很 重要 。 打 印 输出 的 顺序 是 : 首先 是 label L1, 然后 是 C 的 代码 ( 它 和 图 
5-29 中 的 Cecode 的 值 相同 ) , 然后 是 label 12, 最 后 是 对 S 的 递归 调用 所 生成 的 代码 ( 它 和 图 5-29 
中 的 Scode 的 值 相同 ) 。 这 样 , 对 5 的 一 次 调用 所 打印 的 代码 和 图 5-29 中 返回 的 Scode 的 值 相 同 。 


























主 属性 的 类 型 
我 们 的 简单 假设 要 求 主 属 性 具有 字符 串 属 性 , 这 个 限制 实际 上 太 严 格 了 。 真 实 要 求 是 所 
有 主 属性 的 类 型 的 值 必须 能 够 通过 连接 各 个 元 素 而 构造 得 到 。 比 如 , 任何 类 型 的 对 象 列表 也 
可 以 作为 主 属性 的 类 型 ， 只 要 这 些 列表 的 表示 方法 允许 我 们 把 元 素 高 效 地 加 入 到 列表 的 尾 
部 。 因 此 , 如 果 主 属性 的 目的 是 表示 一 个 中 间 代 码 语句 的 序列 ,我们 就 可 以 在 一 个 对 象 数组 
的 尾部 不 断 写 人 语句 , 最 终生 成 中 间 代 码 。 当 然 , 这 个 列表 还 需要 满足 5.5.2 节 中 给 出 的 其 
他 要 求 。 比 如 , 一 个 主 属性 值 必须 由 其 他 主 属性 值 按照 非 终结 符号 的 顺序 连接 得 到 。 











我 们 附带 地 对 基础 SDT 进行 相同 的 修改 : 将 一 个 主 属性 的 构造 转变 为 发 出 这 个 属性 的 元 素 
的 语义 动作 。 在 图 5-32 H, 我 们 可 以 看 到 图 5-28 的 SDT 被 修改 成 边 扫描 边 生成 代码 的 SDT。 


S — while( { L1=new(); L2 = new(); C.false = S.nezt; 
C.true = L2; print("label", L1); } 


C) { S;.next = Ll; print("label", L2); } 
Sı 





图 5-32” 边 扫描 边 生成 while 语句 的 代码 的 SDT 


5.5.3 上 | 上 属性 的 SDD 和 LL 语法 分 析 
假设 一 个 工 属性 SDD 的 基础 文法 是 一 个 LL 文法 , 并 且 我 们 已 经 按照 5.4.5 节 中 描述 的 方法 
把 它 转换 成 一 个 SDT, 其 语义 动作 被 伐 人 到 各 个 产生 式 中 。 然 后 , 我 们 就 可 以 在 LL 语法 分 析 过 
程 中 完成 翻译 过 程 ,其 中 的 语法 分 析 栈 需要 进行 扩展 ， 以 存放 语义 动作 和 属性 求 值 所 需 的 某 些 数 
据 项 。 一 般 来 说 , 这 些 数 据 项 是 属性 值 的 拷贝 。 
除了 那些 代表 终结 符号 和 非 终结 符号 的 记录 之 外 , 语法 分 析 栈 中 还 将 保存 动作 记录 (action- 
record ) 和 综合 记录 (synthesize-record) ， 其 中 动作 记录 表示 即将 被 执行 的 语义 动作 ,而 综合 记录 保 
存 非 终结 符号 的 综合 属性 值 。 我 们 使 用 下 列 两 个 原则 来 管理 栈 中 的 属性 : 
© 非 终 结 符号 4 的 继承 属性 放 在 表示 这 个 非 终结 符号 的 栈 记 录 中 。 对 这 些 属 性 求 值 的 代码 
通常 使 用 紧 靠 在 4 的 栈 记 录 之 上 的 动作 记录 来 表示 。 实 际 上 , 从 工 属性 的 SDD 到 SDT 的 - 
转换 方法 保证 了 动作 记录 将 紧 靠 在 4 的 上 面 。 
o 非 终 结 符号 4 的 综合 属性 放 在 一 个 单独 的 综合 记录 中 , 它 在 栈 中 紧 靠 在 4 的 记录 之 下 。 
这 个 策略 在 语法 分 析 栈 中 放置 了 多 种 类 型 的 记录 , 这 些 不 同 的 记录 类 型 将 被 当 作 “ 栈 记 录 ” 
的 子 类 进行 正确 管理 。 在 实践 中 , 我 们 可 能 把 几 个 记录 组 合成 一 个 记录 , 但 是 如 果 要 解释 这 个 方 
法 的 基本 思想 , 最 好 还 是 把 用 于 不 同 目的 的 数据 分 别 存放 在 不 同 的 记录 中 。 
动作 记录 包含 指向 将 被 执行 的 动作 代码 的 指针 。 动 作 也 可 能 出 现在 综合 记录 中 , 这 些 动作 
通常 把 其 他 记录 中 的 综合 属性 拷贝 到 栈 中 更 低 的 位 置 上 。 在 这 个 综合 属性 所 在 的 记录 被 弹出 栈 
之 后 , 语法 分 析 程 序 需 要 在 这 个 较 低 的 位 置 上 找到 该 属性 的 值 。 
我 们 简单 地 看 一 下 LL 语法 分 析 技 术 , 以 了 解 为 什么 需要 建立 属性 的 临时 拷贝 。 根 据 4. 4.4 
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节 的 介绍 可 知 ,一 个 通过 分 析 表 驱动 的 LL 语法 分 析 器 模拟 了 一 个 最 左 推导 过 程 。 如 果 w 是 至 今 
为 止 已 经 匹配 完成 的 输入 , 那么 栈 中 就 包含 了 一 个 文法 符号 序列 a, HES wa, 其 中 5 是 开始 
符号 。 当 语法 分 析 器 按照 一 个 产生 式 ASB C 展开 的 时 候 , 它 把 栈 顶 的 4 蔡 换 为 B C 

假设 非 终结 符号 C 有 一 个 继承 属性 C i。 对 于 产生 式 4-*B C, 继承 属性 C i 可 能 不 仅仅 依赖 
于 4 的 继承 属性 , 还 可 能 依赖 于 B 的 所 有 属性 。 因 此 , 我 们 可 能 需要 在 计算 C i 之 前 完成 对 8 的 
处 理 。 因 此 , 我 们 需要 计算 C i 所 需 的 所 有 属性 值 的 临时 拷贝 存放 到 计算 C i 的 动作 记录 中 。 否 
则 , 当 语法 分 析 器 把 栈 顶 的 4 替换 为 BC 的 时 候 , 4 的 继承 属性 就 和 它 的 栈 记录 一 起 消失 了 。 

因为 基础 SDD 是 工 属 性 的 , 我 们 可 以 肯定 当 A 位 于 栈 项 时 , 4 的 继承 属性 的 值 是 可 用 的 。 因 
此 当 需 要 把 这 些 值 拷贝 到 对 C 的 继承 属性 求 值 的 动作 记录 中 时 , 这些 值 也 是 可 用 的 。 不 仅 如 此 ， 
用 于 存放 4 的 综合 属性 的 空间 也 不 成 问题 , 因为 这 个 空间 位 于 4 的 综合 记录 中 , 而 这 个 记录 在 语 
法 分 析 器 使 用 4-*B C 进行 展开 时 还 保持 在 分 析 栈 中 (位 于 8 和 C 之 下 )。 

HAAB 时 , 如 果 需 要 , 我 们 可 以 (通过 栈 中 紧 靠 在 B 之 上 的 一 个 记录 ) 执 行 一 个 动作 , 将 它 
的 继承 属性 拷贝 给 C 使 用 。 在 处 理 完 中 之 后 , 如 果 需 要 , B 的 综合 记录 也 可 以 拷贝 它 的 综合 属性 
BEC 使 用 。 类 似 地 , 也 可 能 需要 一 些 临时 变量 来 计算 4 的 综合 属性 的 值 。 这 些 值 可 以 在 先后 处 
BE BAN C 的 时 候 被 拷贝 到 4 的 综合 记录 中 。 所 有 这 些 属性 的 拷贝 工作 能 够 正确 进行 的 原理 是 : 

。 所 有 拷贝 都 发 生 在 对 某 个 非 终 结 符号 的 一 次 展开 时 创建 的 不 同 记录 之 间 。 因 此 , 这 些 记 

录 中 的 每 一 个 都 知道 其 他 各 个 记录 在 栈 中 离 它 有 多 远 ,因此 可 以 安全 地 把 值 写 到 它 下 面 
的 记录 中 。 

下 一 个 例子 说 明了 通过 不 断 地 拷贝 属性 值 , 在 LL 语法 分 析 过 程 中 实现 继承 属性 的 方法 。 有 
可 能 存在 一 些 捷径 或 者 优化 方法 , 对 于 那些 只 把 一 个 属性 值 拷贝 到 另 一 个 属性 值 的 拷贝 规则 而 
言 更 是 如 此 。 我 们 要 到 例 5. 24 中 再 说 明 这 个 问题 , 该 例子 还 演示 了 对 综合 记录 的 处 理 方法 。 
园 汪 时 。 这 个 例子 实现 了 图 5-32 中 的 SDT, 该 SDT 边 扫描 边 为 while 语句 生成 代码 。 这 个 SDT 
中 除了 表示 标号 的 三 属性 之 外 ,没有 综合 属性 。 

图 5-33a 显示 了 我 们 即将 使 用 while 产生 式 来 展开 $ 的 情况 。 这 里 假设 我 们 已 经 知道 输入 的 
向 前 看 符号 就 是 while。 栈 顶 的 记录 对 应 于 $, 它 只 包含 继承 属性 5. next。 我 们 假设 这 个 属性 的 什 
为 x。 因 为 我 们 现在 以 自 顶 向 下 方式 进行 语法 分 析 , 所 以 按照 惯例 把 栈 顶 显示 在 左边 。 



































top 
S a) 
next = T | 
top 
Į _ 
while ( Action C ) Action Sı 
f snezt = z | | false = ? all =? 
Li =? true =? al2 =? 
L2 =? : 
Ll = new(); stack[top 一 I) next = all; 
L2 = newt); print("label", al2); 








stack|top — 1].false = snezt; 
stack[top — 1).true = L2; 
stack{top — 3].al1 = L1; 
stack[top — 3].al2 = L2; 
print("label", L1); b) 
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图 5-33b 显示 了 我 们 展开 S 之 后 的 情况 。 在 非 终结 符号 CMS, 之 前 存在 动作 记录 , 它们 对 
应 于 图 5-32 中 的 基础 SDT 的 语义 动作 。C 的 记录 包含 了 存放 继承 属性 rue 和 false 的 字段 ,而 S, 
的 记录 包含 了 存放 属性 net 的 字段 。 所 有 的 $ 记录 都 必须 包含 这 个 字段 。 我 们 将 这 些 字段 的 值 
显示 为 ?, 因为 我 们 现在 还 不 知道 它们 的 值 。 

接 下 来 , 语法 分 析 器 识别 了 输入 中 的 while 和 ( ,并 将 它们 的 记录 弹出 栈 。 现 在 , 第 一 个 动作 
位 于 栈 顶 , 因此 必须 执行 这 个 动作 。 这 个 动作 记录 有 一 个 字段 set, 该 字段 存放 了 继承 属性 
S. next 的 一 个 拷贝 。 当 $ 被 弹出 栈 的 时 候 ，S. next 的 值 被 拷贝 到 字段 snext Ho TER C 的 继承 属 
性 值 的 时 候 将 用 到 这 个 字段 。 第 一 个 动作 的 代码 生成 了 ZL1 和 12 的 新 值 , 我 们 分 别 将 这 两 个 值 假 
设 为 y 和 z。 下 一 步 是 令 C. true 的 值 等 于 z。 我 们 把 这 个 赋值 语句 写作 stack[ top ~1]. true = L2 Æ 
因为 只 有 当 这 个 动作 记录 位 于 栈 顶 时 这 个 语句 才 会 被 执行 , 因此 top -1 指向 它 下 面 的 记录 , 即 C 
的 记录 。 

第 一 个 动作 记录 将 LI 拷贝 到 第 二 个 动作 记录 的 all 字段 中 , 在 该 处 它 将 用 于 S next 的 求 
值 。 它 也 会 将 [2 拷贝 到 第 二 个 动作 记录 中 的 al2 字段 中 , 第 二 个 动作 需要 这 个 值 来 正确 打印 输 
出 。 最 后 , 第 一 个 动作 记录 将 Label y 打印 到 输出 设备 。 

完成 了 第 一 个 动作 并 将 它 的 记录 弹出 栈 之 后 的 情形 显 top 
示 在 图 5-34 中 。 在 C 的 记录 中 的 继承 属性 值 都 已 经 正确 bo ZI mee IS 















































真 写 好 ,同时 第 二 个 动作 记录 中 的 临时 变量 all 和 al2 也 = nest =? 
已 经 填写 好 。 此 时 C 被 展开 , 我 们 假设 实现 条 件 表达 式 C 

的 包含 了 正确 跳 转 到 x 和 z 的 指令 的 代码 已 经 生成 。 当 C siack[fop 一 二 nezt = all, 

的 记录 被 弹出 栈 时 ，) 的 记录 变 成 了 栈 顶 , 使 得 语法 分 析 器 tae 
检查 输入 中 的 ) o 图 5-34 C 之 上 的 动作 被 执行 之 后 


48, 之 上 的 动作 位 于 栈 顶 时 , 它 的 代码 设置 51. next, 并 打印 出 label z。 上 述 工作 完成 之 
JE, 51 的 记录 成 为 栈 顶 。 随 着 S 被 展开 , 假设 它 正确 地 生成 了 S 的 代码 。 不 管 5 是 什么 类 型 
的 语句 , 生成 的 代码 正确 地 实现 了 这 个 语句 ， 随 后 跳 转 到 yo c 
CE iL SRR while 语句 , 但 是 翻译 方法 把 输出 S. code 作为 一 个 综合 属性 ， 
而 不 是 通过 边 扫描 边 处 理 的 方式 生成 。 记 住 下 面 的 不 变 式 , 或 者 说 归纳 假设 , 有 助 于 理解 接 下 来 
的 解释 。 我 们 假设 这 些 假设 适用 于 每 个 非 终结 符号 : 

。 每 个 具有 代码 的 非 终 结 符号 都 把 它 的 (字符 串 形式 的 ) 代 码 存 放 在 栈 中 该 符号 的 记录 下 方 

的 综合 记录 中 。 

假设 这 个 结论 为 真 , 我 们 处 理 while 产生 式 时 , 将 使 它 在 处 理 完成 后 仍然 成 立 ,成 为 一 个 不 
变 式 。 

图 5-35a 显示 了 使 用 while 语句 的 产生 式 展开 5 之 前 的 情形 。 我 们 在 栈 顶 看 到 的 是 $ 的 记录 。 
和 例 5. 23 中 一 样 , 它 有 一 个 存放 继承 属性 S. next 的 字段 。 紧 靠 在 这 个 记录 之 下 是 S 的 本 次 出 现 
的 综合 记录 , 它 有 一 个 存放 S. code 的 字段 。 每 个 $ 的 综合 记录 都 包含 这 个 字段 。 我 们 还 显示 了 
其 他 一 些 用 于 局 部 存储 和 动作 的 字段 ,因为 图 5-28 中 while 产生 式 的 SDT 实际 上 是 一 个 更 大 的 
SDT 的 一 部 分 。 

我 们 对 5 的 展开 是 基于 图 5-28 中 的 SDT 的 , 展开 的 情形 显示 在 图 5-35b 中 。 作 为 一 种 捷径 ， 
我 们 假设 在 展开 过 程 中 继承 属性 5. next 被 直接 赋 给 C. false, 而 不 是 先 放 到 第 一 个 动作 中 , 然后 再 
拷贝 到 C 的 记录 中 。 
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s Synthesize 
S.code a} 
nezst= x ||code=? 
data 
actions 
top 
3 à Synthesize l Synthesize || Synthesize 
while Action Cc C.code b] Ši code 
Li=? false =? ||code=? nett=? ||code =? code =? 
L2 =? true=? : Ccode =? data 
as : ls? : 
L1 = new(); [stack[top — 3].Ccode = code; | [2 = ?. actions 
L2 = new(); ; 
stack[top 一 1].true = L2; stack{top — 1].code = 
stack{top — 4] .nezt = Ll; "Label" || 11 || Ccode 
stack[top — 5].11 = Ll; || "label" |j 12 || code; 
stack[top 一 5].12 = L2; b) 




















图 5-35 ” 栈 中 构造 的 具有 综合 属性 的 S 的 扩展 


我 们 看 一 下 各 个 记录 在 变 成 栈 顶 的 时 候 会 做 哪些 事情 。 首 先 ，while 记录 使 得 词法 单元 while 
和 输入 匹配 。 这 是 一 定 会 匹配 的 , 否则 我 们 就 不 会 用 这 个 产生 式 来 展开 5。 在 while 和 (被 弹出 栈 
之 后 , 执行 动作 记录 中 的 代码 。 它 生成 了 志和 了 2 的 值 , 我 们 通过 捷径 直接 把 它们 拷贝 到 需要 它 
们 的 继承 属性 中 ， 即 S. next 和 C. true 中 。 这 个 动作 的 最 后 两 个 步 又 把 Ll 和 L2 拷贝 到 被 称 为 
“Synthesize S}. code” 的 记录 中 。 

S, 的 综合 记录 有 两 个 任务 : 它 不 仅仅 要 保存 综合 属性 51. code, 它 还 要 作为 一 个 动作 记录 对 
整个 产生 式 5->while (C) S 的 属性 求 值 。 特 别 是 , 当 它 到 达 栈 顶 时 , 它 将 计算 综合 属性 S. code, 
并 将 这 个 值 放 到 产生 式 头 S 的 综合 记录 中 。 

当 C 成 为 栈 顶 的 时 候 , 它 的 两 个 继承 属性 都 已 经 计算 完成 。 根 据 上 面 给 出 的 归纳 假设 ， 
我 们 假设 它 正确 地 生成 了 代码 , 该 代码 执行 了 它 的 条 件 判断 并 跳 转 到 正确 的 标号 。 我 们 同 
时 假设 在 展开 C 时 执行 的 动作 正确 地 把 这 个 代码 放 在 了 栈 中 下 面 的 记录 中 ,作为 综合 属性 
C. code 的 值 。 

在 C 被 弹出 栈 后 ，C. code 的 综合 记录 成 为 栈 顶 。 它 的 代码 要 在 51. code 的 综合 记录 中 使 用 ， 
因为 我 们 要 在 那里 把 所 有 的 代码 元 素 连 接 起 来 得 到 S. codes KIE, C. code 的 综合 记录 中 有 一 个 语 
义 动 作 把 C. code 拷贝 到 51. code 的 综合 记录 中 。 完 成 上 述 工作 之 后 , 词法 单元 ) 的 记录 到 达 栈 顶 ， 
使 得 语法 分 析 器 检查 输入 中 的 )。 假 设 这 个 测试 成 功 , S 的 记录 变 成 栈 顶 。 根 据 我 们 的 归纳 假 
设 , 这 个 非 终结 符号 被 展开 。 这 次 展开 的 最 终 效 果 是 它 的 代码 被 正确 构造 出 来 , 并 被 放 到 5) 的 
综合 记录 中 存放 code 的 字段 中 。 

HE, S 的 综合 记录 的 所 有 数据 字段 都 已 经 填充 完毕 ,因此 当 它 变 成 栈 顶 时 , 该 记录 
中 的 动作 就 可 以 被 执行 。 这 个 动作 使 得 标号 和 来 自 C. code 和 Sy. code 的 代码 按照 正确 的 顺 
序 被 连接 到 一 起 。 得 到 的 串 放 在 栈 中 下 面 的 记录 中 ,也 就 是 5 的 综合 记录 中 。 我 们 现在 已 
经 正确 地 计算 出 了 S. code, 并 且 当 5 的 综合 记录 变 成 栈 顶 时 ,该 代码 可 以 被 放置 到 栈 中 更 低 
层 的 另 一 个 记录 中 , 在 那里 它 最 终 会 被 组 装 到 一 个 更 大 的 代码 捉 中 , 用 于 实现 了 包含 这 个 $ 
的 更 大 的 程序 元 素 。 口 
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我 们 可 以 处 理 LR 文法 上 的 上 L 属性 SDD 吗 ? 

在 5.4.1 节 中 ,我 们 看 到 在 LR 文法 上 的 每 个 S 属性 SDD 都 可 以 在 自 底 向 上 语法 分 析 过 程 
中 实现 。 根 据 5.3.5 节 ,LL 文法 上 的 每 个 工 属性 都 可 以 在 自 顶 向 下 语法 分 析 中 实现 。 因 为 LL 
文法 类 是 LR 文法 类 的 一 个 真子 集 ,并 且 S 属性 SDD 类 是 工 属性 SDD 类 的 一 个 真子 集 ,那么 我 
们 能 和 否 以 自 底 向 上 的 方式 处 理 每 个 LR 文法 和 每 个 工 属性 SDD YE? 

如 下 面 的 直观 论述 指出 的 ,我 们 不 能 这 么 做 。 假 设 我 们 有 一 个 LR 文法 的 产生 式 ABC, 
并 且 有 一 个 继承 属性 B i, 它 依赖 于 4 的 继承 属性 。 当 我 们 规约 到 B 的 时 候 , 我 们 还 没有 看 到 
由 C 生 成 的 输入 ,因此 不 能 确定 会 扫描 到 产生 式 4 一 BC 的 体 。 因 此 ,我 们 在 此 时 还 不 能 计算 
8.i, 因 为 我 们 不 能 确定 是 否 使 用 和 这 个 产生 式 相 关联 的 规则 。 : 

也 许 我 们 可 以 等 到 已 经 归 约 得 到 C, 并 且 知 道 必须 把 BC 归 约 到 4 时 才 进 行 计算 。 然 而 ， 
| 即使 到 那个 时 候 ,我 们 仍然 不 知道 4 的 继承 属性 ,因为 即使 在 归 约 之 后 ,我 们 仍然 不 能 确定 包 
含 这 个 4 的 是 哪个 产生 式 的 体 。 我 们 可 以 说 这 个 决定 也 应 该 推迟 ,因此 也 需要 将 B. i 的 计算 
进一步 推迟 。 如 果 我 们 继续 这 样 推迟 ,我 们 很 快 会 发 现 必 须 把 所 有 的 决定 推迟 到 对 整个 输入 
的 语法 分 析 完 成 之 后 再 进行 。 实 质 上 ,这 就 是 “ 先 构 造 语法 分 析 树 ,再 执行 翻译 ” 的 策略 。 











5.5.4 上 属性 的 SDD 的 自 底 向 上 语法 分 析 

我 们 可 以 使 用 自 底 向 上 的 方法 来 完成 任何 可 以 用 自 顶 向 下 方式 完成 的 翻译 过 程 。 更 准确 地 
说 , 给 定 一 个 以 LL 文法 为 基础 的 工 属性 SDD, 我 们 可 以 修改 这 个 文法 , 并 在 LR 语法 分 析 过 程 中 
计算 这 个 新 文法 之 上 的 SDD。 这 个 “技巧 "包括 三 个 部 分 : 

1) 以 按照 5.4.5 节 中 的 方法 构造 得 到 的 SDT 为 起 点 。 这 祥 的 SDT 在 各 个 非 终结 符号 之 前 放 
置 语义 动作 来 计算 它 的 继承 属性 , 并 且 在 产生 式 后 端 放置 一 个 动作 来 计算 综合 属性 。 

2) 对 每 个 内 嵌 的 语义 动作 , 向 这 个 文法 中 引 人 一 个 标记 非 终结 符号 来 蔡 换 它 。 每 个 这 样 的 
位 置 都 有 一 个 不 同 的 标记 , 并 且 对 于 任意 一 个 标记 M 都 有 一 个 产生 式 Me, 

3) 如 果 标记 非 终结 符号 M 在 某 个 产生 式 Asaf al8 中 和 蔡 换 了 语义 动作 a, 对 a 进行 修改 得 
Bla’, 并 且 将 a’ 关联 到 Moe 上 。 这 个 动作 a’ 

D 将 动作 a 需要 的 4 或 a 中 符号 的 任何 属性 作为 M 的 继承 属性 进行 拷贝 。 

© 按照 a 中 的 方法 计算 各 个 属性 , 但 是 将 计算 得 到 的 这 些 属性 作为 M 的 综合 属性 。 

这 个 变换 看 起 来 是 非法 的 , 因为 通常 和 产生 式 Me 相关 的 动作 将 不 得 不 访问 某 些 没有 出 现 
在 这 个 产生 式 中 的 文法 符号 的 属性 。 然 而 , 我 们 将 在 LR 语法 分 析 栈 上 实现 各 个 语义 动作 。 因 此 
必要 的 属性 总 是 可 用 的 , 它们 位 于 栈 顶 之 下 的 已 知 位 置 上 。 
DRJ 假设 一 个 I 文法 中 存在 一 个 产生 式 4B C, 而 继承 属性 B. i 是 根据 继承 属性 4. it 
照 某 个 公式 Bi = f(A. i) 计 算得 到 的 。 也 就 是 说 , 我们 关心 的 SDT 片段 是 

A+{Biz=f(Ai)} BC 

我 们 引入 标记 M, M 有 继承 属性 M. i 和 综合 属性 MM.s。 前 者 是 4.i 的 一 个 拷贝 ， 而 后 者 将 成 

为 B.i。 这 个 SDT 将 被 写作 


A+MBC | 
M + {Mi= Aa; M.s = FM 
请 注意 , M 的 规则 中 不 可 以 使 用 4.i, 但 是 实际 上 我 们 将 设法 安排 分 析 栈 , 使 得 如 果 即 将 进 


行 一 个 到 4 的 归 约 , 那么 4 的 每 个 继承 属性 都 将 出 现在 栈 中 执行 这 个 归 约 的 位 置 下 方 ， 从 该 处 就 “ 
可 以 读 到 这 些 继承 属性 。 央 此 ， 当 我 们 将 e 归 约 为 M 时 , 我 们 直接 在 它 的 下 方 找到 A, 在 那里 ， 








语法 制 时 的 翻译 228 
读 取 到 它 的 值 。 另 外 , M. s AEA M — RET, 它 实际 上 是 B. i, 以 后 在 进行 到 8B 的 归 约 
时 可 以 在 下 方 找到 这 个 值 。 z 














为 什么 标记 能 够 正确 工作 ? 

标记 是 只 能 推导 出 的 非 终结 符号 ,每 个 标记 在 所 有 产生 式 体 中 只 出 现 一 次 。 我 们 将 正 
式 证 明 如 果 一 个 文法 是 LL 的 ,那么 标记 非 终结 符号 可 以 被 插入 到 产生 式 体 中 的 任何 位 置 , 并 
且 结 果 文 法 是 LR 的 。 如 果 文 法 是 LL 的 ,那么 我 们 只 需要 看 输入 符号 串 w 的 第 一 个 符号 (如 
Rw 为 空 则 是 下 一 个 符号 ) ,就 可 以 确定 w 是 否 可 以 从 4 开始 ,经 过 一 个 以 产生 式 4 一 a 开头 
的 推导 序列 得 到 。 因 此 ,如果 我 们 用 自 底 向 上 的 方式 对 进行 语法 分 析 ,那么 只 要 w 的 开头 出 
现在 输入 中 ,我们 就 可 以 确定 w 的 一 个 前 组 首先 必须 被 归 约 成 为 a, 然后 再 归 约 到 5。 特 别 是 ， 
如 果 我 们 在 a 的 任何 位 置 插入 标记 ,相应 的 LR 状态 将 隐 含 地 表明 这 个 标记 必定 存在 ,并 将 在 
输入 的 正确 位 置 上 把 e 归 约 为 标记 。 











本 例 中 我 们 把 图 5-28 的 SDT 修改 成 基于 经 过 修改 的 LR 文法 的 SDT, 新 的 SDT 可 以 
和 LR 语法 分 析 器 一 起 完成 翻译 。 我 们 在 C 之 前 引入 标记 MM, 在 Si 之 前 引入 标记 N, 因此 基础 文 
法 变 成 

S ~= while(MC)N S, 


M > e 
N > € 


在 我 们 讨论 标记 MAN 的 关联 动作 之 前 , 先 给 出 有 关 属 性 存放 位 置 的 “归纳 假设 ”。 

1) 在 while 产生 式 的 整个 产生 式 体 之 下 (就 是 说 在 栈 中 的 while 之 下 ) 将 是 继承 属性 S. next. 
我 们 可 能 不 知道 这 个 栈 记录 与 哪个 非 终结 符号 或 语法 分 析 器 状态 相关 , 但 是 我 们 肯定 该 记录 有 
一 个 字段 存放 了 S. next。 这 个 字段 位 于 该 记录 中 的 固定 位 置 上 , 并 且 在 我 们 知道 $ 推导 出 什么 得 
语 之 前 就 已 经 计算 得 到 了 S. next, 

2) 继承 属性 C. true 和 C. false 将 紧 靠 在 C 的 栈 记录 的 下 方 。 因 为 假设 这 个 文法 是 LL 的 , 输 
人 中 出 现 的 while 告诉 我 们 while 产生 式 是 唯一 可 能 被 识别 的 产生 式 , 因此 我 们 可 以 肯定 M Kh 
现在 栈 中 紧 靠 C 的 下 方 , 而 履 的 记录 将 保存 C 的 这 些 继承 属性 。 

3) 类 似 地 , 继承 属性 Si. next 必定 出 现在 栈 中 紧 靠 S 的 下 方 , 因此 我 们 把 该 属性 放 在 的 
记录 中 。 

4) 综合 属性 C. code 将 出 现在 5 的 记录 中 。 我 们 期 望 在 实践 中 这 个 记录 中 出 现 的 是 一 个 指向 
这 个 字符 串 ( 对 象 ) 的 指针 ， 而 该 字符 串 本 身 位 于 栈 外 。 当 有 一 个 属性 的 值 是 很 长 的 字符 串 时 ， 
我 们 总 是 这 样 处 理 。 

5) 类 似 地 , 综合 属性 51. code 将 出 现在 Si 的 记录 中 。 

现在 我 们 跟踪 一 个 while 语句 的 语法 分 析 过 程 。 假 设 一 个 保存 S. next 的 记录 出 现在 栈 顶 , 并 
且 下 一 个 输入 是 终结 符号 while。 我 们 把 这 个 终结 符号 移 人 栈 中 。 此 时 识别 出 的 产生 式 肯 定 是 
while 产生 式 , 因此 LR 语法 分 析 右 可 以 移 人 “(” 并 确定 下 一 步 把 e 归 约 为 于。 此 时 的 栈 显 示 在 图 
5-36 中 。 我 们 同时 还 在 该 图 中 显示 了 和 机 的 归 约 相关 联 的 动作 。 我 们 创建 出 1 和 2 的 值 , 它 
们 被 存放 在 M 的 记录 的 域 中 。 同 处 这 个 记录 还 有 C. true 和 C. false 的 域 。 这 些 属性 必定 在 这 个 记 
录 的 第 二 和 第 三 个 域 中 。 这 是 为 了 和 可 能 在 不 同上 下 文中 出 现 于 CT, 且 需 要 为 C 提供 这 些 
属性 的 其 他 栈 记 录 保 持 一 致 。 这 个 动作 最 后 把 两 个 值 赋 给 C. true 和 C. false。 其 中 的 第 一 个 值 来 
自 于 刚刚 生成 的 £2, 另 一 个 则 从 栈 下 方 存放 S. next 的 地 方 获取 。 














226 Z5 Ë 
































top 
t 
? |[whie]| ( j ™ tele patos MSE 
Snert C.true 中 执行 的 代码 
C. false L1 = new(); 
Li L2 = new(); 
T2 C.true = L2; 
C. false = stack[top — 3].nezt; 











图 5-36 TH e JAH M Zany LR 语法 分 析 栈 
我 们 假设 后 面 的 输入 被 正确 地 归 约 为 C。 因 此 , 综合 属性 C. code 存放 在 C 的 记录 中 。 这 一 
次 对 栈 的 改变 显示 在 图 5-37 中 。 该 图 还 显示 了 接 下 来 将 被 放 到 栈 中 的 多 个 记录 ,它们 将 被 放 到 
C 的 记录 之 上 。 



























































top 
t 
|? while | ( M Cc ) || ¥ i 
S.next C.true || C.code Si.nert ||S1.code 
C. false 
Ll 
L2 
图 5-37 即将 把 while 产生 式 的 体 归 约 为 $ 之 前 的 栈 


继续 识别 while 语句 , 语法 分 析 器 下 一 步 将 在 输入 中 发 现 * )”, 把 它 放 在 该 符号 自己 的 记录 中 , 并 

压 人 栈 中 。 因 为 文法 是 LL 的, 因此 语法 分 析 器 在 该 点 上 已 经 知道 它 在 处 理 一 个 while 语句 。 语 

法 分 析 器 将 把 e 归 约 为 Y。 和 相关 联 的 唯一 数据 是 继承 属性 51. next。 请 注意 , 需要 将 这 个 属 

性 存放 在 此 记录 中 的 原因 是 这 个 记录 将 恰好 位 于 S 的 记录 之 下 。 计 算 Si .next 的 值 的 代码 是 
Si.nezt = stack{top — 3].L1; 

这 个 动作 从 NN 之 下 三 个 记录 的 地 方 获 取 了 L1 的 值 。 当 这 个 代码 执行 的 时 候 , N 的 记录 位 于 
RI. 

接 下 来 , 语法 分 析 器 将 其 余 输 入 的 某 个 前 缀 归 约 成 为 5。 我 们 一 直 把 它 称 为 51 ,以便 和 产生 
AAKI SKYF o Sı code 的 值 计算 完成 并 放 在 Si 的 栈 记录 中 。 这 个 步骤 对 应 于 图 5-37 所 示 的 
情形 。 

此 时 , 语法 分 析 器 将 把 从 while 到 S 的 全 部 内 容 归 约 为 $。 在 这 一 次 归 约 中 , 执行 的 代 
码 是 : 

tempCode = label || stackltop — 4].L1 || stack[ltop — 3].code || 
label || stack[top — 4].L2 || stack{top|.code; 


top = top — 6; 
stack[top].code = tempCode; 


也 就 是 说 , 我 们 在 变量 tempCode 中 构造 出 S. code 的 值 。 该 代码 也 是 由 两 个 标号 L 和 已、C 的 代 
码 和 S, 的 代码 组 成 。 这 个 栈 执行 了 一 些 弹 出 操作 , 因此 S 出 现在 while 原来 出 现 的 地 方 。$ 的 代 
码 值 存 放 在 该 记录 的 code 字段 中 。 它 在 那里 被 解释 为 综合 属性 S. code。 请 注意 , 我 们 在 这 次 讨 
论 中 没有 显示 对 LR 状态 的 操作 , 实际 上 这 些 状态 必须 出 现在 栈 中 ,其 所 在 的 字段 就 是 存放 文法 
符号 的 字段 。 口 
5.5.5 5.5 节 的 练习 

练习 5. 5. 1: 按照 5.5.1 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 实现 为 递归 下 降 的 语法 
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IB 
练习 5.5.2: 按照 5.5.2 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 实现 为 递归 下 降 的 语法 


分 析 器 。 


和 练习 5. 5.3: 按照 5.5.3 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 和 一 个 LL 语法 分 析 器 
一 起 实现 。 它 们 应 该 边 扫 描 输 入 边 生 成 代码 。 

练习 5. 5.4: 按照 5.5.3 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 和 一 个 LL 语法 分 析 器 
一 起 实现 , 但 是 代码 (或 者 指向 代码 的 指针 ) 存 放 在 栈 中 。 

练习 5. 5.5;: 按照 5.5.4 节 的 风格 , 将 练习 5.4.4 中 得 到 的 每 个 SDD 和 一 个 LR 语法 分 析 器 


一 起 实现 o 








练习 5. 5. 6: 按照 5.5.1 节 的 风格 实现 练习 5.2.4 中 得 到 的 SDD。 按 照 5.5.2 节 的 风格 得 到 
的 实现 和 这 个 实现 相 比 有 什么 不 同 吗 ? 


5.6 第 5 章 总 结 


eS 


继承 属性 和 综合 属性 : 语法 制导 的 定义 可 以 使 用 的 两 种 属性 。 一 标语 法 分 析 树 结 点 上 的 
综合 属性 根据 该 结 点 的 子 结 点 的 属性 计算 得 到 。 一 个 结 点 上 的 继承 属性 根据 它 的 父 结 点 
和 /或 兄弟 结 点 的 属性 计算 得 到 。 
依赖 图 : 给 定 一 棵 语法 分 析 树 和 一 个 SDD, 我 们 在 各 个 语法 分 析 树 结 点 所 关联 的 属性 实 
例 之 间 画 上 边 ， 以 指明 位 于 边 的 头 部 的 属性 值 要 根据 位 于 边 的 尾部 的 属性 值 计 算得 到 。 

循环 定义 : 在 一 个 有 问题 的 SDD 中 , 我 们 发 现存 在 一 些 语法 分 析 树 , 无 法 找到 一 个 顺序 





SDD 是 否 存 在 这 种 带 环 的 依赖 图 是 非常 困难 的 。 








5 属性 定义 : 在 一 个 S 属 性 的 SDD 中 , 所 有 的 属性 都 是 综合 的 。 

L 属性 定义 : 在 一 个 工 属性 的 SDD 中, 属性 可 能 是 继承 的 , 也 可 能 是 综合 的 。 然 而 , 一 个 
语法 分 析 树 结 点 上 的 继承 属性 只 能 依赖 于 它 的 父 结 点 的 继承 属性 和 位 于 它 左 边 的 兄弟 结 
点 的 (任意 ) 属 性 。 

抽象 语法 树 : 一 棵 抽象 语法 树 中 的 每 个 结 点 代表 一 个 构造 ; 某 个 结 点 的 子 结 点 表示 该 结 


点 所 对 应 的 构造 的 有 意义 的 组 成 部 分 。 

实现 S 属性 的 SDD: 一 个 S 属 性 定义 可 以 通过 一 个 所 有 动作 都 在 产生 式 尾 部 的 SDT( 后 缀 
SDT) 来 实现 。 这 些 动作 通过 产生 式 体 中 的 各 个 符号 的 综合 属性 来 计算 产生 式 头 的 综合 属 
性 。 如 果 基 础 文法 是 LR 的 , 那么 这 个 SDT 可 以 在 一 个 LR 语法 分 析 器 的 栈 上 实现 。 

从 SDT FHRA: 如 果 一 个 SDT 只 有 副作用 ( 即 不 计算 属性 值 ), 那么 消除 文法 左 递 
归 的 标准 方法 允许 我 们 把 语义 动作 当 作 终 结 符号 移动 到 新 文法 中 去 。 在 计算 属性 时 ,如 
RAA SDT 是 后 缀 SDT, 那么 我 们 仍然 能 够 消除 左 递归 。 

用 递归 下 降 话 法 分 析 实 现 工 属性 的 SDD: 如 果 我 们 有 一 个 工 属 性 定义 , 且 其 基础 文法 可 
以 用 自 顶 向 下 的 方法 进行 语法 分 析 , 我 们 就 可 以 构造 出 一 个 不 带 回潮 的 递归 下 降 语法 分 
析 器 来 实现 这 个 翻译 。 继 承 属 性 变 成 了 非 终结 符号 对 应 的 函数 的 参数 ， 而 综合 属性 由 该 
函数 返回 。 

实现 LL 文法 之 上 的 工 属 性 的 SDD: 每 个 以 LL 文法 为 基础 文法 的 工 属性 定义 可 以 在 语法 
分 析 过 程 中 实现 。 用 于 存放 一 个 非 终 结 符号 的 综合 属性 的 记录 被 放 在 栈 中 这 个 非 终结 符 
号 之 下 ， 而 一 个 非 终结 符号 的 继承 属性 和 这 个 非 终结 符号 存放 在 一 起 。 栈 中 还 放置 了 动 
作 记 录 , 以 便 在 适当 的 时 候 计算 属性 值 。 





o 以 自 底 向 上 的 方式 实现 一 个 在 LL 文法 之 上 的 工 属 性 SDD: 一 个 以 I 文法 为 基础 文法 的 
L 属性 定义 可 以 转换 成 一 个 以 LR 文法 为 基础 文法 的 翻译 方案 , 且 这 个 翻译 可 以 和 自 底 向 
上 的 语法 分 析 过 程 一 起 执行 。 文 法 的 转换 过 程 中 引信 了 “标记 " 非 终结 符号 。 这 些 符号 出 
现在 自 底 向 上 语法 分 析 栈 中 , 并 保存 了 栈 中 位 于 它 上 方 的 非 终结 符号 的 继承 属性 。 在 栈 
H, 综合 属性 和 它 的 非 终结 符号 放 在 一 起 。 
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第 6 章 中 间 代 码 生 成 


在 编译 器 的 分 析 - 综合 模型 中 ,前端 对 源 程序 进行 分 析 并 产生 中 间 表 示 , 后 端 在 此 基础 上 生 
成 目标 代码 。 理 想 情况 下 ,和 源 语言 相关 的 细节 在 前 端 分 析 中 处 理 , 而 关于 目标 机 器 的 细节 则 在 
后 端 处 理 。 基 于 一 个 适当 定义 的 中 间 表 示 形 式 , 可 以 把 针对 源 语言 i 的 前 端 和 针对 目标 机 器 j 的 
后 端 组 合 起 来 ,构造 得 到 源 语 言 i 在 目标 机 器 j 上 的 一 个 编译 器 。 这 种 创建 编译 器 组 合 的 方法 可 
以 大 大 减少 工作 量 : 只 要 写 出 m 种 前 端 和 种 后 端 处 理 程序 , 就 可 以 得 到 m x n 种 编译 程序 。 

本 章 的 内 容 涉 及 中 间 代 码 表示 、 静 态 类 型 检查 和 中 间 代码 生成 。 为 简单 起 见 , 我 们 假设 一 个 
编译 程序 的 前 端 处 理 按照 图 6-1 所 示 方 式 进行 组 织 , 顺序 地 进行 语法 分 析 、 静态 检查 和 中 间 代 码 
生成 。 有 时 候 这 几 个 过 程 也 可 以 组 合 起 来 , 在 语法 分 析 中 一 并 完成 。 我 们 将 使 用 第 2 章 和 第 5 章 
中 的 请 法 制导 定义 来 描述 类 型 检查 和 翻译 过 程 。 大 部 分 的 翻译 方案 可 以 基于 第 5 章 中 给 出 的 自 
顶 向 下 或 自 底 向 上 的 语法 分 析 技 术 来 实现 。 所 有 的 方案 都 可 以 通过 生成 并 遍历 抽象 语法 树 来 

前 端 二 -一 后 端 


实现 。 
分 析 器 
图 6-1 一 个 编译 器 前 端的 逻辑 结构 


静态 检查 包括 类 型 检查 (type checking), 类 型 检查 保证 运算 符 被 应 用 到 兼容 的 运算 分 量 。 静 
态 检查 还 包括 在 语法 分 析 之 后 进行 的 所 有 语法 检查 。 例 如 ,静态 检查 保证 了 C 语言 中 的 一 条 
break 指令 必然 位 于 一 个 while/for/switch 语句 之 内 。 如 果 不 存 在 这 样 的 语句 ,静态 检查 将 报告 一 
个 错误 。 

本 章 介 绍 的 方法 可 以 用 于 多 种 中 间 表 示 , 包括 抽象 语法 树 和 三 地 址 代码 。 这 两 种 中 间 表 示 
方法 都 在 2. 8 节 中 介绍 过 。 之 所 以 名 为 “三 地 址 代码 ”, 是 因为 这 些 指 令 的 一 般 形 式 *=yopz 具 有 
三 个 地 址 : 两 个 运算 分 量 y Mz, 一 个 结果 变量 *。 

在 将 给 定 源 语言 的 一 个 程序 翻译 成 特定 的 目标 机 器 代码 的 过 程 中 , 一 个 编译 器 可 能 构造 出 
一 系列 中 间 表 示 ， 如 图 6-2 所 示 。 高 层 的 表示 接近 于 源 语 言 ， 而 低层 的 表示 接近 于 目标 机 器 。 语 
法 树 是 高 层 的 表示 , 它 刻 画 了 源 程序 的 自然 的 层次 性 结构 , 并 且 适 用 于 静态 类 型 检查 这 样 的 
处 理 。 


























高 层 中 低层 中 
源 程序 一 > ARR 一 一 … 一 一 AKR 一 一 
形式 形式 


图 6-2 编译 器 可 能 使 用 一 系列 的 中 间 表 示 
低层 的 表示 形式 适用 于 机 器 相关 的 处 理 任务 ， 比 如 寄存 器 分 配 、 指 令 选择 等 。 通 过 选择 不 同 
的 运算 符 , 三 地 址 代码 既 可 以 是 高 层 的 表示 方式 , 也 可 以 是 低层 的 表示 方式 。 在 6. 2. 3 节 将 看 
到 , 对 表达 式 而 言 , 语法 树 和 三 地 址 代码 只 是 在 表面 上 有 所 不 同 。 对 于 循环 语句 , 语法 树 表 示 了 
语句 的 各 个 组 成 部 分 , 而 三 地 址 代码 包含 标号 和 跳 转 指令 , 用 来 表示 目标 语言 的 控制 流 。 
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不 同 的 编译 器 对 中 间 表 示 的 选择 和 设计 各 有 不 同 。 中 间 表 示 可 以 是 一 种 真正 的 语言 ,也 可 
以 由 编译 器 的 各 个 处 理 阶段 共享 的 多 个 内 部 数据 结构 组 成 。C 语言 是 一 种 程序 设计 语言 。 它 具 
有 很 好 的 灵活 性 和 通用 性 , 可 以 很 方便 地 把 C 程序 编译 成 高 效 的 机 器 代码 , 并 且 有 很 多 C 的 编译 


器 可 用 , 因此 C 语言 也 常常 被 用 作 中 间 表 示 。 早 期 的 C ++ 编译 器 的 前 端 生成 C 代码 , 而 把 C 编 
译 器 作为 其 后 端 
6.1 语法 树 的 变 体 

语法 树 中 的 各 个 结 点 代表 了 源 程序 中 的 构造 ,一 个 结 点 的 所 有 子 结 点 反映 了 该 结 点 对 应 构 
造 的 有 意义 的 组 成 成 分 。 为 表达 式 构建 的 无 环 有 向 图 ( Directed Acyclic Graph, 以 后 简称 DAG) 指 
出 了 表达 式 中 的 公共 子 表达 式 (多 次 出 现 的 子 表达 式 ) 。 在 本 节 我 们 将 看 到 ,可 以 用 构造 语法 树 
的 技术 去 构造 DAG。 
6.1.1 ”表达 式 的 有 向 无 环 图 

和 表达 式 的 语法 树 类 似 , 一 个 DAG 的 叶子 结 点 对 应 于 原子 运算 分 量 ， 而 内 部 结 点 对 应 于 运 
算 符 。 与 语法 树 不 同 的 是 , 如 果 DAG 中 的 一 个 结 点 N 表示 一 个 公共 子 表达 式 , 则 N 可 能 有 多 个 
父 结 点 。 在 语法 树 中 ,公共 子 表达 式 每 出 现 一 次 ,代表 该 公共 子 表达 式 的 子 树 就 会 被 复制 一 次 。 
因此 , DAG 不 仅 更 简洁 地 表示 了 表达 式 ,而 且 可 以 为 最 终生 成 表达 式 的 高 效 代码 提供 重要 的 
信息 。 
图 6-3 给 出 了 下 面 的 表达 式 的 DAG 


ata* (b- c) + (b-c) *d 


叶子 结 点 a 在 表达 式 中 出 现 了 两 次 , 因此 a 有 两 > va N 
A SS 
a, 

















个 父 结 点 。 值 得 注意 的 是 , AA - "代表 公共 子 表达 
式 b - c 的 两 次 出 现 。 该 结 点 同样 有 两 个 父 结 点 ， 表 
明 该 子 表达 式 在 子 表达 式 a* (b - c) 和 (b -c) +d 
中 两 次 被 使 用 。 尽 管 b 和 c 在 整个 表达 式 中 出 现 了 两 。 图 63 来 大 式 a sax (bc) ， 
次 , 但 它们 对 应 的 结 点 只 有 一 个 父 结 点 , 因为 对 它们 O SDI 
的 使 用 都 出 现在 同样 的 公共 子 表达 式 b -c 中 。 ” 口 

图 6-4 给 出 的 SDD( 语 法 制导 定义 ) 既 可 以 用 来 构造 语法 树 ,也 可 以 用 来 构造 DAG。 它 在 例 
5. 11 中 曾 用 于 构造 语法 树 。 在 那里 ,函数 Leaf 和 Node 每 次 被 调用 都 会 构造 出 一 个 新 结 点 。 要 构 
造 得 到 DAC, 这 些 函 数 就 要 在 每 次 构造 新 结 点 之 前 首先 检查 是 否 已 存在 这 样 的 结 点 。 如 果 存在 
一 个 已 被 创建 的 结 点 ， 就 返回 这 个 已 有 的 结 点 。 例 如 ,在 构造 一 个 新 结 点 Node( op, lefi, righi) 之 
前 , 我 们 首先 检查 是 否 已 存在 一 个 结 点 ， 该 结 点 的 标号 为 op, 且 其 两 个 子 结 点 为 ft M right. 如 
果 存在 这 样 的 结 点 ，Node 函数 返回 这 个 已 存在 的 结 点 ， 否 则 它 创建 一 个 新 结 点 。 : 

















产生 式 语义 规则 
rl) Eo E +T E.node = new Node('+', E\.node, T.node) 

2) E> E -T E.node = new Node('~—', Ei node, T.node) 
3) E>T E.node = T.node 

TOT,*F T.node = new Node('*',T, node, F. node) 
4) To {EBE) T.node = E.node 
5) Tid T.node = new Leaf (id, id.entry) 
6) T > num T.node = new Leaf (num, num.val) 

















图 6-4 生成 语法 树 或 DAG 的 语法 制导 定义 
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GGA 图 65 给 出 了 构造 图 6-3 所 示 DAC MATHER. MEIE, 函数 Node 和 Leaf 尽 可 

能 地 返回 已 存在 的 结 点 。 我 们 假设 entry-a 指向 符号 表 中 i anon 

J ae ss = Pa Ji a se ` OTL 2 w 

与 4 对 应 的 项 , 其 他 标识 符 的 处 理 方式 与 此 类 似 。 Sey een eae 
当 在 第 2 步 再 次 调用 Leaf(id, entry-c) it, KARA 3) p= Leaf (id, entry-b) 

的 是 之 前 调用 生成 的 结 点 , 因此 ps =p1。 类 似 地 , 第 8 步 | 5 PA Seti 

和 第 9 步 返回 的 结 点 分 别 和 第 3 步 及 第 4 步 返 回 的 结果 | 6) po = Nodel’s', pips) 

-一 = x be ` T = Nod E P6 
相同 ( 即 ps =a, Po =pa)o PURE, 第 10 步 返回 的 结 点 必 | 中 T S a 
然 和 第 5 步 中 返回 的 结 点 相同 ， 即 Pio =Dso O 9) pg = Leaf (id, entry-c) = pg 
6.1.2 构造 DAG 的 值 编码 方法 aE 

ed = > HANIAN: 11) pir = Leaf (id, entry-d) 
语法 树 或 DAG 图 中 的 结 点 通常 存放 在 一 个 记录 数组 | 12) Pi = Nadel" ps.) 
中 ,如 图 6-6 所 示 。 数 组 的 每 -- 行 表示 一 个 记录 , 也 就 是 ”| rss Model Ppa) 








一 个 结 点 。 在 每 个 记录 中 , 第 一 个 字段 是 一 个 运算 符 代 图 6.5 图 6.3 所 示 的 DAC 的 构造 过 程 
B, 也 是 该 结 点 的 标号 。 在 图 6-6b 中 , 各 个 叶子 结 点 还 

有 一 个 附加 的 字段 ， 它 存放 了 标识 符 的 词法 值 (在 这 里 , 它 是 一 个 指向 符号 表 的 指针 或 一 个 党 
量 ) 。 内 部 结 点 则 有 两 个 附加 的 字段 ,分 别 指明 其 左右 子 结 点 。 














iia} 到 ;对 应 
bs TE 
hi 3| + ,112 
SS 4 = !113 
i 10 5 z 
a) DAG b) 数组 


图 6-6 i=i+10 的 DAG 的 结 点 在 数组 中 的 表示 


在 这 个 数组 中 , 我 们 只 需要 给 出 一 个 结 点 对 应 的 记录 在 此 数组 中 的 整数 下 标 就 可 以 引用 该 
结 点 。 在 历史 上 , 这 个 整数 称 为 相应 结 点 或 该 结 点 所 表示 的 表达 式 的 值 编码 (value number) 。 例 
如 , 在 图 6-6 中 , 标号 为 “+” 的 结 点 的 值 编码 为 3, 其 左右 子 结 点 的 值 编码 分 别 为 1 和 2。 在 实践 
F, 我 们 可 以 用 记录 指针 或 对 象 引 用 来 代替 整数 下 标 , 但 是 我 们 仍然 把 一 个 结 点 的 引用 称 为 该 结 
点 的 “ 值 编码 ”。 如 果 使 用 适当 的 数据 结构 , 值 编码 可 以 帮助 我 们 高 效 地 构造 出 表达 式 的 DAG, 
下 一 个 算法 将 给 出 构造 的 方法 。 

假定 结 点 按照 如 图 66 所 示 的 方式 存放 在 一 个 数组 中 , 每 个 结 点 通过 其 值 编码 引用 。 设 每 个 
内 部 结 点 的 范 型 为 三 元 组 <op, L, r>, EP op 是 标号 ,! 是 其 左 子 结 点 对 应 的 值 编码 , r 是 其 右 
子 结 点 对 应 的 值 编码 。 假 设 单 目 运算 符 对 应 的 结 点 有 r=0。 
构造 DAG 的 结 点 的 值 编码 方法 。 

输入 : 标号 op、 结 点 1 和 结 点 r。 

输出 : 数组 中 具有 三 元 组 < op, L, r > 形式 的 结 点 的 值 编 码 。 

方法 : 在 数组 中 搜索 标号 为 op、 左 子 结 点 为 ! 且 右 子 结 点 为 7 的 结 点 村 。 如 果 存 在 这 样 的 结 
AB, WERE 让 结 点 的 值 编码 。 若 不 存在 这 样 的 结 点 ， 则 在 数组 中 添加 一 个 结 点 N, 其 标号 为 op, 
左右 子 结 点 分 别 为 1 和 7, 返回 新 建 结 点 对 应 的 值 编码 。 口 

虽然 算法 6. 3 可 以 产生 我 们 期 待 的 输出 结果 , 但 是 每 次 定位 一 个 结 点 时 都 要 搜索 整个 数组 ， 
这 个 开销 是 很 大 的 ， 当 数组 中 存放 了 整个 程序 的 所 有 表达 式 时 尤其 如 此 。 更 高 效 的 方法 是 使 用 
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散 列表 , 将 结 点 放 入 若干 “ 桶 ”中 ,每 个 桶 通常 只 包含 少量 结 点 。 散 列表 是 能 够 高 效 支 持 词典 
(dictionary) 功能 的 少数 几 个 数据 结构 之 一 9。 词典 是 一 种 抽象 的 数据 类 型 , 它 可 以 插入 或 删除 一 
个 集合 中 的 元 素 , 可 以 确定 一 个 给 定 元 素 当 前 是 否 在 集合 中 。 类 似 于 散 列表 这 样 为 词典 设计 的 
优秀 数据 结构 可 以 在 常数 或 接近 常数 的 时 间 内 完成 上 述 的 操作 ,所 需 时 间 和 集合 的 大 小 无 关 。 

要 给 DAG 中 的 结 点 构造 散 列表 , 首先 需要 建立 散 列 函数 (hash function)h。 这 个 函数 为 形 如 
<op, 1, r> 的 三 元 组 计算 * 桶 "的 索引 。 它 通过 计算 索引 把 三 元 组 分 配 到 各 个 桶 中 , 并 使 得 不 大 
可 能 存在 某 个 “ 桶 ”的 元 组 数量 大 大 超过 平均 数 很 多 。 通 过 对 op, L. r 的 计算 ,可 以 确定 地 得 到 桶 
索引 h(op, l, r) 。 因 而 我 们 可 以 多 次 重复 这 个 计算 过 程 , 总 是 得 到 结 点 <op, l, r> 的 相同 的 桶 
索引 。 l 
桶 可 以 通过 链表 来 实现 , 如 图 6-7 所 未 。 一 个 由 散 列 值 索 引 的 数组 保存 桶 的 头 (bucket head- 
er) 。 每 个 头 指向 列表 中 的 第 一 个 单元 。 在 一 个 桶 的 链表 中 , 链表 的 各 个 单元 记录 了 某 个 被 散 列 
函数 分 配 到 此 桶 中 的 某 个 结 点 的 值 编码 。 也 就 是 说 , 在 以 数组 的 第 ACop, L, r) 个 元 素 为 头 的 链 
表 中 可 以 找到 结 点 <op, 1, r>。 


0 表示 结 点 
foo 的 元 素 链表 


opr o 


引 的 桶 头 的 数组 











20) = 2 
| 


图 6-7 用 于 搜索 桶 的 数据 结构 


因此 , 给 定 一 个 输入 结 点 (op, 1, r), 我 们 首先 计算 桶 索引 hh(op, lr), 然后 在 该 桶 的 单元 中 
搜索 这 个 结 点 。 通 常情 况 下 有 足够 多 的 桶 ,因此 链表 中 不 会 有 很 多 单元 。 然 而 , 我 们 必须 查看 一 
个 桶 中 的 所 有 单元 , 并 且 对 于 每 一 个 单元 中 的 值 编码 v, 我 们 必须 检查 输入 结 点 的 三 元 组 < op, |, 
r> 是 否 和 单元 列表 中 值 编 码 为 v 的 结 点 相 匹 配 ( 如 图 6-7 所 示 )。 如 果 我 们 找到 了 匹配 的 结 点 ， 
就 返回 w。 如 果 没 有 找到 匹配 的 结 点 , 我 们 知道 其 他 桶 中 也 不 会 有 这 样 的 结 点 。 因 此 , 我 们 就 创 
建 一 个 新 的 单元 , 添加 到 “ 桶 "索引 为 h(op, 1, 7) 的 单元 链表 中 , 并 返回 新 建 结 点 对 应 的 值 编码 。 
6. 1.3 6.1 节 的 练习 

练习 6. 1. 1: 为 下 面 的 表达 式 构 造 DAG 

(Caty) -—C(aty) * (x—y))) +((x+y) * (x—y)) 

练习 6. 1. 2: 为 下 列表 达 式 构造 DAG, 且 指 出 它们 的 每 个 子 表达 式 的 信 编 码 。 假 定 + BAS 
合 的 。 

1)a+b+ (a+b) 





2)atbtath 


3)at+a+(atatat+(atatata)) 


© BW Aho, A.V. , J. E. Hopcroft 和 于 D. Ullman 所 著 的 《数据 结构 与 算法 》( Data Structures and Algorithms, Addison- 
Wesley 出 版 社 1983 年 出 版 ) 。 其 中 有 关于 支持 词典 功能 的 数据 结构 的 讨论 。 
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6.2 三 地 址 代码 
在 三 地 址 代码 中 , 一 条 指令 的 右 侧 最 多 有 一 个 运算 符 。 也 就 是 说 , 不 允许 出 现 组合 的 算术 表 
达 式 。 因 此 , x ty rz 这 样 的 源 语 言 表达 式 要 被 翻译 成 如 下 的 三 地 址 指令 序列 。 


ty =y* 之 
te =x +t) 


fet, Alt, 是 编译 器 产生 的 临时 名 字 。 因 为 三 地 址 代码 拆 分 了 多 运算 符 算术 表达 式 以 及 控制 
语句 的 嵌 套 结构 ,所 以 适用 于 目标 代码 的 生成 和 优化 。 具 体 的 过 程 将 在 第 8 、9 章 中 详细 介绍 。 
因为 可 以 用 名 字 来 表示 程序 计算 得 到 的 中 间 结 果 , 所 以 三 地 址 代码 可 以 方便 地 进行 重组 。 

PE = 地 二 代 码 是 一 标语 法 树 或 一 个 DAG 的 线性 表示 形式 。 三 地 址 代码 中 的 名 字 对 应 于 
图 中 的 内 部 结 点 。 图 6-8 中 再 次 给 出 了 图 6-3 中 的 DAC, 以 及 该 图 对 应 的 三 地 址 代码 序列 。 ” 口 


信人 th 
+ x tı = a*t 
bs a tz = atte 
PR ty = tl *d 
a 一 ts = tg + t4 ` 
/ N 
b E 
a) DAG b) 三 地 址 代码 


图 6-8 一 个 DAG 及 其 对 应 的 三 地 址 代码 


6.2.1 地 址 和 指令 
三 地 址 代码 基于 两 个 基本 概念 : 地 址 和 指令 。 按 照 面 向 对 象 的 说 法 , 这 两 个 概念 对 应 于 两 个 
类 ,而 各 种 类 型 的 地 址 和 指令 对 应 于 相应 的 子 类 。 另 一 种 方法 是 用 记录 的 方式 来 实现 三 地 址 代 
码 , 记录 中 的 字段 用 来 保存 地 址 。6. 2. 2 节 将 简要 介绍 被 称 为 四 元 式 和 三 元 式 的 记录 表示 方式 。 
地 址 可 以 具有 如 下 形式 之 一 : 
e 名 字 。 为 方便 起 见 , 我 们 允许 源 程 序 的 名 字 作 为 三 地 址 代码 中 的 地 址 。 在 实现 中 , WA 
序 名 字 被 替换 为 指向 符号 表 条 目的 指针 。 关 于 该 名 字 的 所 有 信息 均 存 放 在 该 条 目 中 。 
e 常量 。 在 实践 中 , 编译 器 往往 要 处 理 很 多 不 同类 型 的 常量 和 变量 。6. 5. 2 节 将 考虑 表达 式 
中 的 类 型 转换 问题 。 
e 编译 器 生成 的 临时 变量 。 在 每 次 需要 临时 变量 时 产生 一 个 新 名 字 是 必要 的 , 在 优化 编译 
器 中 更 是 如 此 。 当 为 变量 分 配 寄存 器 的 时 候 , 我 们 可 以 尽 可 能 地 合并 这 些 临 时 变量 。 

下 面 我 们 介绍 本 书 的 其 余部 分 常用 的 几 种 三 地 址 指令 。 改 变 控制 流 的 指令 将 使 用 符号 化 标 
号 。 每 个 符号 化 标号 表示 指令 序列 中 的 一 条 三 地 址 指令 的 序号 。 通 过 一 次 扫描 , 或 者 通过 回填 
技术 就 可 以 把 符号 化 标号 替换 为 实际 的 指令 位 置 。 回 填 技术 将 在 6.7 节 中 讨论 。 下 面 给 出 几 种 
常见 的 三 地 址 指令 形式 ; 

1) ÉA x =y op z 的 赋值 指令 , 其 中 op 是 一 个 双 目 算术 符 或 逻辑 运算 符 。x、y、z 是 地 址 。 

2) 形 如 x =opy 的 赋值 指令 , 其 中 op BR ABR. BAWABA BISA, BE 
和 转换 运算 。 将 整数 转换 成 浮 点 数 的 运算 就 是 转换 运算 的 一 个 例子 。 

3) 形 如 x=y 的 复制 指令 , 它 把 y 的 值 赋 给 x。 

4) 无 条 件 转移 指令 goto L， 下 一 步 要 执行 的 指令 是 带 有 标号 上 的 三 地 址 指令 。 

5) 形 如 ifx gotoLMif False x goto 工 的 条 件 转 移 指 令 。 分 别 当 x 为 真 或 为 假 时 ,这 











234 B68 





两 个 指令 的 下 一 步 将 执行 带 有 标号 也 的 指令 。 否 则 下 一 步 将 照常 执行 序列 中 的 后 一 条 指令 。 

6) 形 如 if x relop y goto 虐 的 条 件 转移 指令 。 它 对 x Ay 应 用 一 个 关系 运算 符 ( <、==、 
>=) Ux Aly 之 间 满 足 relop KR, 那么 下 一 步 将 执行 带 有 标号 上 的 指令 ,否则 将 执行 指 
序列 中 跟 在 这 个 指令 之 后 的 指令 。 

7) 过 程 调用 和 返回 通过 下 列 指令 来 实 ee 
nz 分别 进行 过 程 调用 和 消 数 调用 ; return y 是 返回 指令 ， 其 中 y 表示 返回 值 ， 令 是 可 选 的 。 
这 些 三 地 址 指令 的 常见 用 法 见 下 面 的 三 地 址 指令 序列 


param zı 
param r2 


param £n 
call p,n 


它 是 过 程 p(xi , xs,… ,x ) 的 调用 的 一 部 分 。“ call p, n” PH n 是 实在 参数 的 个 数 。 这 个 n 并 
RATAN, 因为 存在 其 套 调用 的 情况 。 也 就 是 说 ,前面 的 一 些 param 语句 可 能 是 p 返回 之 后 
才 执 行 的 某 个 函数 调用 的 参数 , 而 的 返回 值 又 成 为 这 个 后 续 函 数 调用 的 男 一 个 参数 。 过 程 调用 
的 实现 将 在 6.9 节 中 加 以 介绍 。 
8) wide =yl[i]M@xli] =y. x =yli ESKER ME y 处 ;个 内 存单 元 的 位 

置 中 存放 的 值 赋 给 x。 指 令 cli] =y 将 距离 位 置 x 处 i 个 内 存单 元 的 位 置 中 的 内 容 设 置 为 y 的 值 。 

9) EAN x= &y, x= eens y 的 地 址 及 指针 赋值 指令 。 指 令 x = &y 将 x 的 右 值 设置 为 
的 地 址 ( 左 值 )93。 这 个 通常 是 一 个 名 字 ， 也 可 能 是 一 个 临时 变量 量 。 它 表示 一 个 诸如 A[i][j] 
这 样 具 有 左 值 的 表达 式 。x 是 一 个 指针 名 字 或 临时 变量 。 在 指令 x= *y 中 , 假定 7 是 一 个 指针 ， 
或 是 一 个 其 右 值 表示 内 存 位 置 的 临时 变量 。 这 个 指令 使 得 x 的 右 值 等 于 存储 在 这 个 位 置 中 的 值 。 
最 后 ， 指令 * x= y ANJE y 的 右 值 赋 给 由 x 指向 的 目标 的 右 值 。 
考虑 语句 

do i = i+1; while (alil < v); 
图 6-9 给 出 了 这 个 语句 的 两 种 可 能 的 翻译 。 在 图 6-9a 的 翻译 中 , 第 一 条 指令 上 附加 了 一 个 符号 化 
标号 上 。 图 6-9b 中 的 翻译 显示 了 每 条 指令 的 位 置 号 , 我 们 在 图 中 选择 以 100 作为 开始 位 置 。 在 两 
种 翻译 中 , 最 后 一 条 指令 都 是 目标 为 第 一 条 指令 的 条 件 转移 指令 。 乘 法 运算 i * 8 适用 于 每 个 元 








素 占 8 个 存储 单元 的 数组 。 口 
L: t= i+i 100: t; =i+í 
i= tl 101: i= t} 
t= i* 8 102: tg =i * 8 
ts =a [to ] 103: t} =a [ty l! 
if t3 < v goto L 104: if ty < v goto 100 
a) 符号 标号 b) 位 置 号 


图 6-9 给 三 地 址 指令 指定 标号 的 两 种 方法 


选择 使 用 哪些 运算 符 是 中 间 表 示 形 式 设 计 的 一 个 重要 问题 。 显 然 ， 这 个 运算 符 集合 中 的 运 
算 符 要 足够 丰富 ,以 便 实 现 源 语言 中 的 所 有 运算 。 接 近 机 器 指令 的 运算 符 可 以 使 在 目标 机 器 上 实 
现 中 间 表 示 形 式 更 加 容易 。 然 而 ,如果 前 端 必 须 为 菜 些 源 语言 运算 生成 很 长 的 指令 序列 ,那么 优 





O 2.8.3 TRA, 左 值 和 右 值 分 别 表示 赋值 左 / 右 部 。 
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化 器 和 代码 生成 器 就 需要 花费 更 多 的 时 间 去 重新 发 现 程 序 的 结构 , 然后 才能 为 这 些 运 算 生成 高 
质量 的 目标 代码 。 
6.2.2 四 元 式 表示 

上 面 对 三 地 址 指令 的 描述 详细 说 明了 各 类 指令 的 组 成 部 分 , 但 是 并 没有 描述 这 些 指令 在 茶 
个 数据 结构 中 的 表示 方法 。 在 编译 器 中 , 这 些 指 令 可 以 实现 为 对 象 , 或 者 是 带 有 运算 符 字 段 和 运 
算 分 量 字 有 段 的 记录 。 四 元 式 、 三 元 式 和 间接 三 元 式 是 三 种 这 样 的 描述 方式 。 

一 个 四 元 式 (quadruple) 有 四 个 字段 , RIOSEK op, arg, arga, resulto FE op 包含 一 个 
运算 符 的 内 部 编码 。 举 例 来 说 , 在 三 地 址 指令 x =y +z 相应 的 四 元 式 中 ,op 字段 中 存放 +, arg, 
Ay, arg, PAz, resuli 中 为 x。 下面 是 这 个 规则 的 一 些 特例 : 

1) ÉAN x= minus y 的 单 目 运算 符 指 令 和 赋值 指令 =y 不 使 用 argo 注意 , 对 于 像 +=y 这 
样 的 赋值 语句 ，op 是 = ， 而 对 大 部 分 其 他 运算 而 言 , 赋值 运算 符 是 隐 含 表示 的 。 

2) & param 这 样 的 运算 既 不 使 用 arg, , 也 不 使 用 resulto 

3) 条 件 或 非 条 件 转移 指令 将 目标 标号 放 人 result 字段 。 

ES) RIE) a -b，- c :+b* -c 的 三 地 址 代码 如 图 6-10a 所 示 。 这 里 我 们 使 用 特殊 的 
minus 运 等 符 来 表示 “- c" 中 的 单 目 减 运算 符 ” -”, 以 区 别 于 “b - c” 中 的 双 目 减 运 算 符 ~”。 
请 注意 , 单 日 减 的 三 地 址 语句 中 只 有 两 个 地 址 复制 语句 a = ts 也 是 如 此 。 






































图 6-10b 描述 了 实现 图 6-10a 中 三 地 址 代码 的 四 元 式 序 列 。 口 

OP arg, arg, result 

t) = minus c 0 /minus + coy ty 

tə = b* ty 1 * j b i ti T te 

t3 = minus c 2|minus; c ; i t3 

t; = b * t3 3 * i b a tg. ta | 

ts = to + t4 4[ 4 | to | ta; ty 

a= ts 5 = | ts a 

a) 三 地 址 代码 b) 四 元 式 





图 6-10 三 地 址 代码 及 其 四 元 式 表 示 


为 了 提高 可 读 性 , 我 们 在 图 6-10b 中 直接 用 实际 标识 符 ， 比 如 用 a、b、c 来 描述 arg, arg, 以 
及 result 字段 , 而 没有 使 用 指向 相应 符号 表 条 目的 指针 。 临 时 名 字 可 以 像 程序 员 定 义 的 名 字 一 样 
被 加 入 到 符号 表 中 , 也 可 以 实现 为 Temp 类 的 对 象 , 这 个 Temp 类 有 自己 的 方法 。 

6.2.3 三 元 式 表 示 

一 个 三 元 式 (triple) 只 有 三 个 字段 , 我 们 分 别称 之 为 op、arg! 和 argz。 请 注意 , 图 6-10b 中 的 
resull 字 段 主要 被 用 于 临时 变量 名 。 使 用 三 元 式 时 , 我 们 将 用 运算 x op y 的 位 置 来 表示 它 的 结果 ， 
而 不 是 用 一 个 显 式 的 临时 名 字 表 示 。 例 如 , 在 三 元 式 表 示 中 将 直接 用 位 置 (0), 而 不 是 像 图 6-10b 
中 那样 用 临时 名 字 t,， 来 表示 对 相应 运算 结果 的 引用 。 带 有 括号 的 数字 表示 指向 相应 三 元 式 结 构 
的 指针 。 在 6.1.2 节 中 , 位 置 或 指向 位 置 的 编码 被 称 为 值 编码 。 

三 元 式 基 本 上 和 算法 6. 3 中 的 结 点 范 型 等 价 。 因 此 , 表达 式 的 DAG 表示 和 三 元 式 表 示 是 等 
价 的 。 当 然 这 种 等 价 关 系 仅 对 表达 式 成 立 ， 因 为 语法 树 的 变 体 和 三 地 址 代码 分 别 以 完全 不 同 的 
a 
图 6-11 中 给 出 的 语法 树 和 三 元 式 表示 对 应 于 图 6-10 中 的 三 地 址 代码 及 四 元 式 序列 。 
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在 图 6-11b 给 出 的 三 元 式 表 示 中 , 复制 语句 a =t, 按照 下 列 方式 表示 为 一 个 三 元 式 : 在 字段 arg 
中 放置 a, 而 在 字段 arg, 中 放置 三 元 式 位 置 的 值 编码 (4) 。 

Reali] =y 这 样 的 三 元 运算 在 三 元 式 结构 中 需要 两 个 条 目 。 例如 ,我 们 可 以 把 x i 置 于 一 
个 三 元 式 中 , 并 把 y 置 于 另 一 个 三 元 式 中 。 类 似 的 , 我 们 可 以 把 x=y[ 疏 看 成 是 两 条 指令 t=Yy[ 站 
和 x%=t， 从 而 用 三 元 式 实现 这 个 语句 。 其 中 的 t 是 编译 器 生成 的 临时 变量 。 请 注意 , 实际 上 上 是 
不 会 出 现在 三 元 式 中 的 , 因为 在 三 元 式 结 构 中 是 通过 相应 三 元 式 结构 的 位 置 来 引用 临时 值 的 。 




















为 什么 我 们 需要 复制 指令 ? 
如 图 6-10a 所 示 ,一 个 简单 的 翻译 表达 式 的 算法 往往 会 为 赋值 运算 生成 复制 指令 。 在 该 图 
中 ,我 们 将 ts 复制 给 a, 而 不 是 直接 将 to +t, 赋 给 .a。 通 常 ,每 个 子 表达 式 都 会 有 一 个 它 自 


已 的 新 临时 变量 来 存放 运算 结果 。 只 有 当 处 理 赋值 运算 符 = 时 ,我 们 才 知道 将 把 整个 表达 式 
的 结果 赋 到 哪里 。 一 个 代码 优化 过 程 将 会 发 现 ts 可 以 被 奉 换 为 a。 这 个 优化 过 程 可 能 使 用 
6.1.1 节 中 描述 的 DAG 作为 中 间 表 示 形 式 。 











Op aT9,  argy 














a N O|minus; c ， 
a F 
1| * rb (0 
A we X á 2|minus; c | 
x | op 
Lo \ fs N 3 i * 1, by (2) 
b minus b minus 1]; + , (1). (3) 
i a ee T 
| | 5, = 4, a , (A) 
C C ai 
a) 语法 树 b) 三 元 式 


图 6-11 a=b* -c+bhs -ec 的 表示 


在 优化 编译 器 中 , 由 于 指令 的 位 置 常常 会 发 生变 化 ,四 元 式 相对 于 三 元 式 的 优势 就 体现 出 来 
了 。 使 用 四 元 式 时 ,如 果 我 们 移动 了 一 个 计算 临时 变量 上 的 指令 , 那些 使 用 i 的 指令 不 需要 做 任 
何 改变 。 面 使 用 三 元 式 时 ,对 于 运算 结果 的 引用 是 通过 位 置 完成 的 , 因此 如 果 改 变 一 条 指令 的 位 
置 , 则 引用 该 指令 的 结果 的 所 有 指令 都 要 做 相应 的 修改 。 使 用 下 面 将 要 介绍 的 间接 三 元 式 时 就 
不 会 出 现 这 个 问题 。 

间接 三 元 式 (indirect triple) 包 含 了 一 个 指向 三 元 式 的 指针 的 列表 ， 而 不 是 列 出 三 元 式 序列 本 
身 。 例 如 , 我们 可 以 使 用 数组 instruction 按照 适当 的 顺序 列 出 指向 三 元 式 的 指针 。 这 样 ， 图 6-11b 
中 的 三 元 式 序列 就 可 以 表示 成 为 图 6-12 所 示 的 形式 。 









































instruction. op Qrg} args 
35 | (0) Q{minus; c ， | 
36 | (1) i * Tb ‘(0) 
37 | (2) | 2/minus; c ; 
38 | (3) | 3 * 1. by (2) 
39 | (4) 4| + 1 (1) (3) 
40 | (5) 5| = 1 a (4) 
图 6-12 三 地 址 代码 的 间接 三 元 式 表 示 
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使 用 间接 三 元 式 表示 方法 时 ， 优 化 编译 器 可 以 通过 对 instruction 列表 的 重新 排序 来 移动 指令 
HEE, 但 不 影响 三 元 式 本 身 。 在 用 Java 实现 时 ,一 个 指令 对 象 的 数组 和 间接 三 元 式 表示 类 他， 
因为 Java 将 数组 元 素 作为 对 象 引 用 来 处 理 。 

6.2.4 静态 单 赋值 形式 
静态 单 赋值 形式 (SSA) 是 另 一 种 中 间 表 示 形 式 , 它 有 利于 实现 某 些 类 型 的 代码 优化 。SSA 和 





三 地 址 代码 的 区 别 主要 体现 在 两 个 方面 。 首 先 , SSA 中 的 所 有 
赋值 都 是 针对 具有 不 同名 字 的 变量 的 ,这 也 是 “静态 单 赋值 "这 ER 
一 名 字 的 由 来 。 图 6-13 给 出 了 分 别 以 三 地 址 代码 形式 和 欧 态 音 p=-a*a 
赋值 形式 表示 的 中 间 程序 。 注 意 ,SSA 表示 中 对 变量 和 a 的 ae 
每 次 定 值 都 以 不 同 的 下 标 加 以 区 分 。 | 


在 一 个 程序 中 , 同一 个 变量 可 能 在 两 个 不 同 的 控制 流 路 径 a) 三 地 址 代码 
中 被 定 值 。 例 如 , 下 列 源 程序 


if ( flag ) x = -1; else x = 1; 
yrux* a; 


中 ,在 两 个 不 同 的 控制 流 路 径 中 被 定 值 。 如 果 我 们 对 条 件 语 句 
的 真 分 支 和 假 分 支 中 的 * 使 用 不 同 的 变量 名 , 那么 我 们 应 该 在 





赋值 运算 y =x * a 中 使 用 哪个 名 字 ? 这 也 是 SSA 的 第 二 个 特别 b) 洽 态 单 赋值 形式 
之 处 。SSA 使 用 一 种 被 称 为 o 函数 的 表示 规则 将 x 的 两 处 定 值 6-13 ”三 地 址 代码 形式 和 
合并 起 来 : SSA 形式 的 中 间 程 序 

if ( flag ) x; = -1; else xy = Í; 


x3 = ġ(xı, X2); 

如 果 控 制 流 经 过 这 个 条 件 语句 的 真 分 支 , 4(xi, xz ) 的 值 为 xi ; 否则 ,如 果 控 制 流 经 过 假 分 
支 , 4 函数 的 值 为 xs 。 也 就 是 说 , 根据 到 达 包 含 6 函数 的 赋值 语句 的 不 同 控 制 流 路 径 ，6$ 沙 数 返回 
不 同 的 参数 值 。 
6.2.5 6.2 节 的 练习 

练习 6. 2. 1: 将 算术 表达 式 a + - (b +c) 翻译 成 

1) 抽象 语法 树 

2) 四 元 式 序列 

3) 三 元 式 序列 

4) 间接 三 元 式 序列 

练习 6.2.2: 对 下 列 赋值 语句 重复 练习 6.2. 1。 

1)a= bli] + c[j] 

2) ali] = b*c - bx*d 

3)x =.f(y+1) + 2 

4)x = ep + ky 

| 练习 6.2.3: 说 明 如 何 对 一 个 三 地 址 代码 序列 进行 转换 , 使 得 每 个 被 定 值 的 变量 都 有 唯一 
的 变量 名 。 


6.3 类 型 和 声明 


可 以 把 类 型 的 应 用 划分 为 类 型 检查 和 翻译 : 
o 类 型 检查 (type checking) 。 类 型 检查 利用 一 组 逻辑 规则 来 推理 一 个 程序 在 运行 时 刻 的 行 
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为 。 更 明确 地 讲 , 类 型 检查 保证 运算 分 量 的 类 型 和 运算 符 的 预期 类 型 相 匹配 。 例 如 ，Java 
要 求 && 运算 符 的 两 个 运算 分 量 必须 是 boolean 型 。 如 果 满 足 这 个 条 件 ， 结 果 也 具有 boolean 
类 型。 
o 翻译 时 的 应 用 (translation application)。 根 据 一 个 名 字 的 类 型 , 编译 器 可 以 确定 这 个 名 字 
在 运行 时 刻 需要 多 大 的 存储 空间 。 类 型 信息 还 会 在 其 他 很 多 地 方 被 用 到 , 包括 计算 一 个 
数组 引用 所 指示 的 地 址 , 插入 显 式 的 类 型 转换 ,选择 正确 版 本 的 算术 运算 符 ， 等 等 。 
在 这 一 节 中 , 我 们 将 考虑 在 菜 个 过 程 或 类 中 声明 的 名 字 的 类 型 及 存储 空间 布局 问题 。 一 个 
过 程 调 用 或 对 象 的 实际 存储 空间 是 在 运行 时 刻 ( 当 该 过 程 被 调用 或 该 对 象 被 创建 时 ) 进行 分 配 的 。 
然而 ， 当 我 们 在 编译 时 刻 检查 局 部 声明 时 ,可 以 进行 相对 地 址 (relative address) 的 布局 ,一 个 名 字 
或 某 个 数据 结构 分 量 的 相对 地 址 是 指 它 相对 于 数据 区 域 开 始 位 置 的 偏 移 量 。 
6.3.1 类 型 表达 式 
类 型 自身 也 有 结构 ,我 们 使 用 类 型 表达 式 (type expression ) 来 表示 这 种 结构 : 类 型 表达 式 可 能 
是 基本 类 型 ,也 可 能 通过 把 被 称 为 类 型 构造 工 子 的 运算 符 作 用 于 类 型 表达 式 而 得 到 。 基 本 类 型 
的 集合 和 类 型 构造 算 子 根据 被 检查 的 具体 语言 而 定 。 
BEG 数组 类 型 int[2][3 ] 表 示 “ 由 两 个 数组 组 成 的 数组 , 其 中 的 每 个 数组 各 包含 3 个 整 








数 ”。 它 的 类 型 表达 式 可 以 写成 array (2, aray(3, inte- ee 
&er) ) 。 该 类 型 可 以 用 如 图 6-14 所 示 的 树 来 描述 。array 2 - ith 
运算 符 有 两 个 参数 : 一 个 数字 和 一 个 类 型 。 口 一 





3 integer 





我 们 将 使 用 如 下 的 类 型 表达 式 的 定义 ， 
o 基本 类 型 是 一 个 类 型 表达 式 。 一 种 语言 的 基本 类 图 6-14 intl2j[3] 的 类 型 表达 式 
型 通常 包括 boolean, char, integer, float 和 void。 最 后 一 个 类 型 表示 “没有 值 ”。 
。 类 名 是 一 个 类 型 表达 式 。 
。 将 类 型 构造 算 子 array 作用 于 一 个 数字 和 一 个 类 型 表达 式 可 以 得 到 一 个 类 型 表达 式 。 
© 一 个 记录 是 包含 有 名 字段 的 数据 结构 。 将 record 类 型 构造 算 子 应 用 于 字段 名 和 相应 的 类 
型 可 以 构造 得 到 一 个 类 型 表达 式 。 在 6. 3. 6 节 中 , 记录 类 型 的 实现 方法 是 把 构造 算 子 re- 
cord 应 用 于 包含 了 各 个 字段 对 应 条 目的 符号 表 。 
o 使 用 类 型 构造 算 子 一 可 以 构造 得 到 函数 类 型 的 类 型 表达 式 。 我 们 把 “从 类 型 * 到 类 型 ;的 
函数 "写成 * 一 上 。 在 6.5 节 中 讨论 类 型 检查 时 ,函数 类 型 是 有 用 的 。 
© 如果 s 和 + 是 类 型 表达 式 , 则 其 笛 卡 儿 积 * xi 也 是 类 型 表达 式 。 引 人 人 笠 卡 儿 积 主要 是 为 了 
保证 定义 的 完整 性 。 它 可 以 用 于 描述 类 型 的 列表 或 元 组 (例如 , 用 于 表示 函数 参数 )。 我 
们 假定 x 具有 左 结合 性 , 并 且 其 优先 级 高 于 一 。 
。 类 型 表达 式 可 以 包含 取 值 为 类 型 表达 式 的 变量 。 在 6. 5.4 节 中 将 用 到 编译 器 产生 的 类 型 
变量 。 
图 是 表示 类 型 表达 式 的 一 种 比较 方便 的 方法 。 可 以 修改 6. 1. 2 节 中 给 出 的 值 编码 方法 ， 以 构 
造 一 个 类 型 表达 式 的 DAG。 图 的 内 部 结 点 表示 类 型 构造 算 子 , 而 叶子 结 点 是 基本 类 型 、 类 型 名 或 
类 型 变量 。6. 1. 4 给 出 了 一 棵 树 的 实例 。 














O 类 型 名 代表 类 型 表达 式 ,， 因 此 可 能 形成 隐 式 的 环 ， 见 “类 型 名 和 递归 类 型 "部 分 。 如 果 到 达 类 型 名 的 边 被 重 定向 到 a 





该 名 字 对 应 的 类 型 表达 式 , 那么 得 到 的 图 中 就 可 能 因为 存在 递归 类 型 而 出 现 环 。 
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类 型 名 和 递归 类 型 


在 C++ 和 Java P, 类 一 旦 被 定义 ,其 名 字 就 可 以 被 用 来 表示 类 型 名 。 例 如 ,考虑 下 列 程 
ofp BOP Node 类 。 


ak class Node {--- } 


~ public Node n; 
小 类 型 名 还 可 以 用 来 定义 递归 类 型 ,在 像 链表 这 样 的 数据 结构 中 要 用 到 递归 类 型 。 一 个 列表 元 
, 素 的 伪 代 码 如 下 : 


class Cell { int info; Cell next; --- } 
. 它 定义 了 一 个 递归 类 型 cell。 这 个 类 包括 一 个 info 字段 和 另 一 个 Cel1 类 型 的 字段 next 。 
在 :C 中 可 以 通过 记录 和 指针 来 定义 类 似 的 递归 类 型 。 本 章 介绍 的 技术 也 适用 于 递归 类 型 。 











6. 3.2 ”类 型 等 价 
_ ”两 个 类 型 表达 式 什么 时 候 等 价 呢 ? 很 多 类 型 检查 规则 具有 这 样 的 形式 ,“ 如 果 两 个 类 型 表达 
式 相 等 ,那么 返回 某 种 类 型 ,否则 出 错 ”。 当 给 一 些 类 型 表达 式 命 名 , 并 且 这 些 名 字 在 之 后 的 其 
他 类 型 表达 式 中 使 用 时 就 可 能 会 产生 肢 义 。 关 键 问题 在 于 一 个 类 型 表达 式 中 的 名 字 是 代表 它 自 
身 呢 , 还 是 被 看 作 另 一 个 类 型 表达 式 的 一 种 缩写 形式 。 

当 用 图 来 表示 类 型 表达 式 的 时 候 , 两 种 类 型 之 间 结 构 等 价 (structurally equivalent) 当 且 仅 当下 
面 的 某 个 条 件 为 真 : 
> e 它们 是 相同 的 基本 类 型 。 
> 0 它们 是 将 相同 的 类 型 构造 算 子 应 用 于 结构 等 价 的 类 型 而 构造 得 到 。 

e 一 个 类 型 是 另 一 个 类 型 表达 式 的 名 字 。 

如 果 类 型 名 仅仅 代表 它 自身 , 那么 上 述 定义 中 的 前 两 个 条 件 定 义 了 类 型 表达 式 的 名 等 价 
(name equivalence) 关系 。 

如 果 我 们 使 用 算法 6.3, 那么 名 等 价 表达 式 将 被 赋予 相同 的 值 编码 。 结 构 等 价 关系 可 以 使 用 
6.5.5 节 中 给 出 的 合 一 算法 进行 检验 。 
6.3.3 声明 

我 们 在 研究 类 型 及 其 声明 时 将 使 用 一 个 经 过 简化 的 文法 , 在 这 个 文法 中 一 次 只 声明 一 个 名 

Se Ea 10 中 讨论 的 那样 进行 处 理 。 我 们 使 用 的 文法 如 下 : 


Tid; D | & 
BC | record {DY 
int | float 

C >œ «| [num] C 
“EPR Arb Hl it 7s 38 Te 2 2K TY HY A ARERR 5. 3. 2 节 中 描述 的 继承 属性 。 本 节 的 不 同 之 
处 在 于 我 们 不 仅 考虑 类 型 本 身 , 还 考虑 各 个 类 型 的 存储 布局 。 

非 终结 符 号 D 生成 一 系列 声明 。 非 终结 符号 了 生成 基本 类 型 、 数 组 类 型 或 记录 类 型 。 非 终 
结 符号 B 生成 基本 类 型 int 和 float 之 一 。 非 终结 符号 C( 表 示 “ 分 量 " ) 产生 零 个 或 多 个 整数 ， 
每 个 整数 用 方 括号 括 起 来 。 一 个 数组 类 型 包含 一 个 由 B 指定 的 基本 类 型 , 后 面 跟 一 个 由 非 终 结 
符号 C 指定 的 数组 分 量 。 一 个 记录 类 型 (7 的 第 二 个 产生 式 ) 由 各 个 记录 字段 的 声明 序列 构成 ， 
并 被 花 括号 括 起 来 。 
6.3.4 局 部 变量 名 的 存储 布局 

从 变量 类 型 我 们 可 以 知道 该 变量 在 运行 时 刻 需 要 的 内 存 数 量 。 在 编译 时 刻 , 我 们 可 以 使 用 

这 些 数 量 为 每 个 名 字 分 配 一 个 相对 地 址 。 名 字 的 类 型 和 相对 地 址 信息 保存 在 相应 的 符号 表 条 目 
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中 。 对 于 字符 串 这 样 的 变 长 数据 ,以 及 动态 数组 这 样 的 只 有 在 运行 时 刻 才能 够 确定 其 大 小 的 数 
据 ， 处 理 的 方法 是 为 指向 这 些 数据 的 指针 保留 一 个 已 知 的 固定 大 小 的 存储 区 域 。 运 行 时 刻 的 存 
请 管理 问题 将 在 第 7 章 中 讨论 。 





地 址 对 齐 
数据 对 象 的 存储 布局 受 目 标 机 器 的 寻 址 约束 的 影响 。 比 如 , 将 整数 相 加 的 指令 往往 希望 
整数 能 够 对 齐 (aligned) ,也 就 是 说 ,希望 它们 被 放 在 内 存 中 的 特定 位 置 上 ,比如 地 址 能 够 被 4 
整除 的 位 置 上 。 虽 然 -一 个 有 10 个 字符 的 数组 只 需要 足以 存放 10 个 字符 的 字 节 空间 , 但 编译 
器 常常 会 给 它 分 配 12 个 字 节 ， 即 下 一 个 4 的 倍数 ,这样 会 有 2 个 字 节 没有 使 用 。 因 为 对 齐 的 
要 求 而 分 配 的 无 用 空间 被 称 为 “ 补 白 "(padding) 。 当 空间 比较 宝贵 时 ,编译 器 需要 对 数据 进 
行 压缩 ( pack) ,此 时 不 存在 “ 补 白 " 空 间 , 但 可 能 需要 在 运行 时 刻 执行 额外 的 指令 把 被 压缩 的 
数据 重新 定位 ,以 便 这 些 数据 看 上 去 仍然 是 对 齐 的 ， 从 而 进行 相关 运算 。 














假设 存储 区 域 是 连续 的 字 节 块 , 其 中 字 节 是 可 和 寻 址 的 最 小 内 存单 位 。 一 个 字 节 通常 有 8 个 二 
进 制 位 , 若干 字 节 组 成 一 个 机 器 字 。 多 字 节 数据 对 象 往往 被 存储 在 一 段 连续 的 字 节 中 , 并 以 初始 
字 节 的 地 址 作为 该 数据 对 象 的 地 址 。 l 

类 型 的 宽度 (width) 是 指 该 类 型 的 一 个 对 象 所 需 的 存储 单元 的 数量 。 一 个 基本 类 型 ， 比 如 字 
符 型 、 整 型 和 淫 点 型 ,需要 整数 多 个 的 字 节 。 为 方便 访问 , 为 数组 和 类 这 样 的 组 合 类 型 数据 分 配 
的 内 存 是 一 个 连续 的 存储 字 节 块 S。 

图 6-15 中 给 出 的 翻译 方案 (SDT) 计算 了 基本 类 型 和 数组 类 型 以 及 它们 的 宽度 。 记 录 类 型 将 
在 6.3.6 节 中 讨论 。 这 个 SDT 为 每 个 非 终 结 符号 使 用 综合 属性 type 和 width。 它 还 使 用 了 两 个 变 
EHu, 变量 的 用 途 是 将 类 型 和 宽度 信息 从 语法 分 析 树 中 的 B 结 点 传递 到 对 应 于 产生 式 Ce 
的 结 点 。 在 语法 制导 定义 中 , 1 和 w 将 是 C 的 继承 属性 。 








T= B {t= B.type; w = B.width; } 
C { T type =C.type; T. width =C. width } 
B 一 int { B.type = integer, B.width = 4; } 
B => float { B.type = float; B.width = 8; } 
C > e { C.type = t; C. width = w; } 
C > [mm] C, { C.type = array(num.value, C;.type); 
C.width = num.value x C1.width, } 





图 6-15 计算 类 型 及 其 宽度 


T 产 生 式 的 产生 式 体 包含 一 个 非 终 结 符 号 8、 一 个 动作 和 一 个 非 终 结 符号 C, 其 中 C 显示 在 
下 一 行 上 。B 和 C 之 间 的 动作 是 将 :设置 为 8. ope, 并 将 ww 设置 为 B. width, WR B 一 int, 则 
B. type 被 设置 为 integer，B. width 被 设置 为 4， 即 一 个 整 型 数 的 宽度 。 类 似 的 , 如 果 B—float, 则 
B. type 和 B. width 分 别 被 设置 为 loat 和 8， 即 宽度 为 一 个 浮 点 数 的 宽度 。 

C 的 产生 式 决 定 了 7 牛 成 的 是 一 个 基本 类 型 还 是 一 个 数组 类 型 。 如 果 Coe, Mt 变 成 
_C. type, H w 变 成 C. width, i 

否则 ，C 就 描述 了 一 个 数组 分 量 。C 一 [num] C1 的 动作 将 类 型 构造 算 子 aray 应 用 于 运算 分 后 
num. value 和 C). type, 构造 得 到 C. type。 例如, 应 用 array 的 结果 可 能 是 图 6-14 ARATE SAP 


ge 








它 所 指向 对 象 的 类 型 之 前 就 为 它 分 配 存储 空间 。 
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数组 的 宽度 是 将 数组 元 素 的 个 数 乘 以 单个 数组 元 素 的 宽度 而 得 到 的 。 如 果 连 续 存 放 的 整数 
的 地 址 之 间 的 差距 为 4, 那么 一 个 整数 数组 的 地 址 计算 将 包含 乘 4 运 算 。 这 样 的 乘法 运算 为 优化 
提供 了 机 会 , 因此 让 前 端 程序 在 其 输出 中 明确 描述 这 些 运算 将 有 助 于 优化 。 在 这 一 章 中 , 我 们 将 
忽略 其 他 与 机 器 相关 特性 ， 比 如 数据 对 象 的 地 址 必须 和 机 器 字 的 边界 对 齐 。 
例 ee, 类 型 int[21[3 1] 的 语法 分 析 树 用 图 6-16 中 的 虚线 描述 。 图 中 的 实 线 描述 了 type 和 
width 是 如 何 从 B 结 点 开始 , 通过 变量 上 和 w, 沿 着 多 个 C 组 成 的 链 下 传 , 然后 又 作为 综合 属性 
ype 和 width 沿 此 链 返 回 的 。 在 访问 包含 C 结 点 的 子 树 之 前 , 变量 上 和 w 被 赋予 B. type 和 B. width 
的 值 。 变 量 上 和 zw 的 值 在 Ce 对 应 的 结 点 上 使 用 , 然后 开始 沿 着 多 个 C 结 点 组 成 的 链 向 上 对 综 
合 属性 求 值 。 口 


T type = array(2, array(3, integer)) 
width = 24 








tS ae oF 
B l tine t= integer - C type = array(2, array(3, integer) ) 
ype = integer w=4 ; width = 24 : 





width = 4 
: width | SR 
int 2). yi type = array(3, integer) 
| z | “width = 12 
N type = integer 
[3] mad width = 4 
ee 


€ 
图 6-16 数组 类 型 的 语法 制导 翻译 


6.3.5 声明 的 序列 

像 C 和 Java 这 样 的 语言 支持 将 单个 过 程 中 的 所 有 声明 作为 一 个 组 进行 处 理 。 这 些 声明 可 能 
分 布 在 一 个 Java 过 程 中 , 但 是 仍然 能 够 在 分 析 该 过 程 时 处 理 它们 。 因 此 , 我 们 可 以 使 用 一 个 变 
量 ， 比 如 offser, 来 跟踪 下 一 个 可 用 的 相对 地 址 。 

图 6-17 中 的 翻译 方案 处 理 形 如 了 证 的 声明 的 序列 ,其 中 的 7 了 如 图 6-15 所 示 产 生 一 个 类 型 。 
”在 考虑 第 一 个 声明 之 前 ,offset 被 设置 为 0。 每 处 理 一 个 变量 * 时 , * 被 加 入 符号 表 , 它 的 相对 地 
址 被 设置 为 fse 的 当前 值 。 随 后 , x 的 类 型 的 宽度 被 加 到 offset 上 。 

产生 式 DoT id ; Di 中 的 语义 动作 首先 
执行 top. put (id. lexeme, T. type, offset), BIE 
一 个 符号 表 条 上 月。 这 里 的 top 指向 当前 的 符号 





-一 一 一 一 一 


Ps { offset = 0; } 
D 








D = Tid; { top.put(id.lereme, T.type, offset); 
offset = offset+ T.width; } 











表 。 方 法 top. put 为 id. lereme 创建 一 个 符号 表 Dı 
ZA, 该 条 目的 数据 区 中 存放 了 类 型 了 .tpe |P 7“ 
和 相对 地 址 offset 图 6-17 计算 被 声明 变量 的 相对 地 址 
如 果 我 们 把 第 一 个 产生 式 写 在 同一 行 中 ; 

P—+{ offset =0; | D (6.1) 
则 图 6-17 中 对 offset 的 初始 化 处 理 就 变 得 更 容易 理解 。 和 后 成 6 的 非 终结 符号 称 为 标记 非 终结 符 
F, 其 作用 是 重 写 产生 式 , 使 得 所 有 的 语义 动作 都 出 现在 产生 式 右 部 的 尾 端 , 具体 方法 见 5. 5.4 
节 。 使 用 标记 非 终结 符号 M，(6. 1) 可 以 被 改写 为 ; 

P— MD 


M-e | offset =0; | 
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6.3.6 记录 和 类 中 的 字段 

图 6-17 中 对 声明 的 翻译 方案 还 可 以 用 于 处 理 记录 和 类 中 的 字段 。 要 把 记录 类 型 加 入 到 图 
6-15 所 示 的 文法 中 ,只 需要 加 上 下 面 的 产生 式 : 

T — record '| 'D'|' 

这 个 记录 类 型 中 的 字段 由 生成 的 声明 序列 描述 。 图 6-17 中 的 方法 可 以 用 来 确定 这 些 字段 的 类 
型 和 相对 地 址 ， 当 然 我 们 需要 小 心地 处 理 下 面 两 件 事 : 

o 一 个 记录 中 各 个 字段 的 名 字 必 须 是 互 不 相同 的 。 也 就 是 说 , 在 由 刀 生 成 的 声明 中 , 同一 个 

名 字 最 多 出 现 一 次 。 

。 字 段 名 的 偏 移 量 , 或 者 说 相对 地 址 , 是 相对 于 该 记录 的 数据 区 字段 而 言 的 。 
CM 在 一 个 记录 中 , PEF x 用 作 字段 名 并 不 会 和 记录 外 对 该 名 字 的 其 他 使 用 产生 冲突 。 
因此 下 列 声 明 中 对 x 的 三 次 使 用 是 不 同 的 , 互相 之 间 并 不 冲突 。 

float x; 


record { float x; float y; } p; 
record { int tag; float x; float y; } q; 


这 些 声 明之 后 的 一 个 赋值 语句 x =p. x + q. x; 把 变量 x 的 值 设置 为 记录 p Ma 中 x 字 段 的 值 的 
和 。 请 注意 , p 中 x 的 相对 地 址 和 gq 中 x 的 相对 地 址 是 不 同 的 。 O 

为 方便 起 见 ， 记 录 类 型 将 使 用 一 个 专用 的 符号 表 , 对 它们 的 各 个 字段 的 类 型 和 相对 地 址 进行 
编码 。 记 录 类 型 形 如 record(t) , 其 中 record 是 类 型 构造 算 子 ,1 是 一 个 符号 表 对 象 , 它 保 存 了 有 关 
该 记录 类 型 的 各 个 字段 的 信息 。 

图 6-18 中 的 翻译 方案 包含 一 个 产生 式 , 该 产生 式 将 加 入 到 图 6-15 中 关于 了 的 产生 式 中 。 这 
个 产生 式 有 两 个 语义 动作 。 在 D 之 前 嵌入 的 动作 首先 保存 top 指向 的 已 有 符号 表 , 然后 让 top 指 
向 新 的 符号 表 。 该 动作 还 保存 了 当前 offset E, 并 将 offsei 重 置 为 0。D 生成 的 声明 会 使 类 型 和 相 
对 地 址 被 保存 到 新 的 符号 表 中 。D 之 后 的 语义 动作 使 用 op 创建 一 个 记录 类 型 ,然后 恢复 早先 保 
存 好 的 符号 表 和 偏 移 值 。 

















T > record'{' { Env.push(top); top = new Env(); 
Stack.push(offset); offset = 0; } 
D'Y { T.type = record(top); T.width = offset; 
top = Env.pop(); offset = Stack.pop(); } 





图 6-18 处理 记录 中 的 字段 名 


为 了 使 翻译 方案 更 加 具体 ,图 6-18 中 的 动作 给 出 了 某 个 实现 的 伪 代 码 。 令 Emn 类 实现 符号 
表 。 对 Env. push( top) 的 调用 将 top 所 指 的 当前 符号 表 压 人 一 个 栈 中 。 然 后 , 变量 top 被 设置 为 指 5 
向 一 个 新 的 符号 表 。 类 似 的 , offa 被 推 人 名 为 Stack WRP, offset 变量 被 重 置 为 0。 : 

在 刀 中 的 声明 被 翻译 之 后 , 符号 表 top 保存 了 这 个 记录 中 所 有 字段 的 类 型 和 相对 地 址 。 而 ， 
E, offset 还 给 出 了 存放 所 有 字段 所 需 的 存储 空间 。 第 二 个 动作 将 7. type 设 为 record (top)， 并 将 
T. width BOW offset. SRG, BEE top 和 offset 将 被 恢复 为 原先 被 压 人 栈 中 的 值 ， 以 完成 这 个 记录 类 : 
型 的 翻译 。 

有 关 记 录 类 型 存储 方式 的 讨论 还 可 以 被 推广 到 类 ， 因 为 我 们 无 需 为 类 中 的 方法 保留 存储 空 
间 。 见 练习 6.3.2, 
6.3.7 6.3 节 的 练习 

练习 6. 3.1: 确定 下 列 声明 序列 中 各 个 标识 符 的 类 型 和 相对 地 址 。 


y 
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float x; 
record { float x; float y; } p; 
record { int tag; float x; float y; } q; 


ers 将 图 6-18 对 字段 名 的 处 理 方法 扩展 到 类 和 和 单 继承 的 类 层次 结构 。 
给 出 类 Eno 的 一 个 实现 。 该 实现 支持 符号 表 链 ,使 得 子 类 可 以 重 定 义 一 个 字段 名 , 也 可 
eee asthe 
2) 给 出 一 个 翻译 方案 , 该 方案 能 够 为 类 中 的 字段 分 配 连 续 的 数据 区 域 , 这 些 字段 中 包含 继 
承 而 来 的 域 。 继承 而 来 的 字段 必须 保持 在 对 超 类 进行 存储 分 配 时 获得 的 相对 地 址 。 


6.4 表达 式 的 翻译 


本 章 剩 下 的 部 分 将 介绍 在 翻译 表达 式 和 话 铝 时 出 现 的 问题 。 在 本 节 中 , 我 们 首先 考虑 从 表 
达 式 到 三 地 址 代码 的 翻译 。 一 个 带 有 多 个 运算 符 的 表达 式 ( 比 如 ec+2sc) 将 被 翻译 成 为 每 条 指 
今 最 多 包含 一 个 运算 符 的 指令 序列 。 一 个 数组 引用 4A[ 疏 [门将 被 扩展 成 一 个 计算 该 引用 的 地 址 的 
三 地 址 指令 序列 。 我 们 将 在 6. 5 节 中 考虑 表达 式 的 类 型 检查 , 并 在 6.6 节 中 介绍 如 何 使 用 布尔 表 
达 式 来 处 理 程序 的 控制 流 。 

6.4. 1 表达 式 中 的 运算 

图 6-19 中 的 语法 制导 定义 使 用 5 的 属性 code 以 及 表达 式 E 的 属性 addr 和 code, 为 一 个 赋值 
语句 S 生成 三 地 址 代码 。 属 性 S. code 和 和 E. code 分 别 表示 S 和 对 应 的 三 地 址 代码 。 属 性 E. addr 
则 表示 存放 五 的 值 的 地 址 。 回 忆 一 下 6.2. 1 节 , 一 个 地 址 可 以 是 变量 名 字 、 常 量 或 编译 器 产生 的 


临时 量 。 

















FER 语义 规则 
S => id=E; S.code = E.code | 
gen(top.get(id.lereme) '= E.addr) 





E > E+E | E.addr = new Temp () 
E.code = Ej ,code || E2.code || 
gen(E.addr'=' Ei.addr '+' E2.addr) 


| -E E.addr = new Temp () 
E.code = Ey.code || 
gen( E.addr ‘=’ ‘minus’ E}.addr) 





| CE) E.addr = Ei.addr 
E.code = Ey.code 


| id E.addr = top.get(id.lereme) 
E.code ="" 














图 6-19 ”表达 式 的 三 地 址 代码 


考虑 图 6-19 中 语法 制导 定义 的 最 后 一 AEA Eid, 若 表 达 式 只 是 一 个 标识 符 ， 比 如 说 
x, 那么 + 本 身 就 保存 了 这 个 表达 式 的 值 。 这 个 产生 式 对 应 的 语义 规则 把 E. addr 定义 为 指向 该 id 
的 实例 对 应 的 符号 表 条 目的 指针 。 令 top 表示 当前 的 符号 表 。 当 函数 top. get 被 应 用 于 id 的 这 个 
实例 的 字符 串 表示 id. lereme WY, 它 返 回 对 应 的 符号 表 条 目 。E. code 被 设置 为 空 串 。 

当 规 则 为 E 一 (Ei) 时 , WE ORE Tei E 的 翻译 相同 。 因 此 ，E. addr 等 于 
Ei. addr, E. code 等 于 E,. code, 

图 6-19 中 的 运算 符 + 和 单 目 -是 典型 语言 中 的 运算 符 的 代表 。E=El +E, 的 语义 规则 生成 
了 根据 E, 和 的 什 计 算 E 的 值 的 代码 。 计 算得 到 的 值 存放 在 新 生成 的 临时 变量 中 。 如 果 Ey 的 
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值 计算 后 被 放 入 By. addr, Ey 的 值 被 放 到 En. addr 41, IBA E, + Ey 就 可 以 被 翻译 为 上 1= 忆 .cddr+ 
E,. addr, 其 中 1 是 一 个 新 的 临时 变量 。E. addr BURA to 连续 执行 new Temp( ) 会 产生 一 系列 互 
不 相同 的 临时 变量 fy, bayttto 

为 方便 起 见 , 我 们 使 用 记号 genla '=' y +'z) 来 表示 三 地 址 指令 x =y +z. 当 被 传递 给 gen 
时 , 变量 x、y、z 的 位 置 上 出 现 的 表达 式 将 首先 被 求 值 ， 而 像 ' = 这 样 的 引号 内 的 字符 串 则 按照 字 
面值 传递 SS。 其 他 的 三 地 址 指令 的 生成 方法 类 似 , 也 是 将 gen 作用 于 表达 式 和 字符 串 的 组 合 

当 我 们 翻译 产生 式 EE, +E, 时 ,图 6-19 中 的 语义 规则 首先 将 Eb. code 和 Ey. code 连接 起 
来 , 然后 再 加 上 一 条 将 El ME, 的 值 相 加 的 指令 , 从 而 生成 E. code。 新 增加 的 这 条 指令 将 求 和 的 
结果 放 入 一 个 为 EE 生成 的 | aent, 用 addr 表示 。 

产生 式 E> -E 的 翻译 过 程 与 此 类 似 。 这 个 规则 首先 为 创建 一 个 新 的 临时 变量 , 并 生成 
一 条 指令 来 执行 单 日 -运算 。 

BA, 产生 式 3$ 一 id =F; 所 生成 的 指令 将 表达 式 的 值 赋 给 标识 符 。 和 规则 Lid 中 一 
样 , 这 个 产生 式 的 语义 规则 使 用 函数 top. get 来 确定 id 所 代表 的 标识 符 的 地 址 。5. code 包含 的 指 
令 首先 计算 的 值 并 将 其 保存 到 由 E. addr 指定 的 地 址 中 , 然后 再 将 这 个 值 赋 给 这 个 id 实例 的 地 
Dk top. get (id. lexeme) 。 . 
图 6-19 中 的 语法 制导 定义 将 赋值 语句 a = + - c; 翻译 成 如 下 的 三 地 址 代码 序列 : 





t; = minus c 
te = b+ t] 
a= te 


口 
6.4.2 增 量 翻 译 
code 属性 可 能 是 很 长 的 字符 串 , 因此 就 像 5. 5. 2 节 中 讨论 的 那样 , 它们 通常 是 用 增 量 的 方 
式 生成 的 。 因 此 , 我 们 不 会 像 图 6-19 所 示 的 那样 构造 E. code, 我 们 可 以 设法 像 图 6-20 中 那样 只 
生成 新 的 三 地 址 指令 。 在 这 个 增 量 方式 中 ,gen 不 仅 要 构造 出 一 个 新 的 三 地 址 指令 , 还 要 将 它 添 
加 到 至 今 为 止 已 生成 的 指令 序列 之 后 。 指 令 序 列 可 以 暂时 放 在 内 存 中 以 便 进一步 处 理 , 也 可 以 
增 量 地 输出 。 
图 6-20 中 的 翻译 方案 和 图 6-19 中 的 S = id=E; { gen( top.get(id.lereme) '=' E.addr): } 
语法 制导 定义 产生 相同 的 代码 。 采 用 增 








E => E+E, { E.addr = new Temp(); 


HT ROTH 再 用 到 code 属性 ， 因 为 对 gon ddd Ey.addr + E>.addr); } 
gen 的 连续 调用 将 生成 一 个 指令 序列 。 

paris ile | -E { E.addr = new Temp (): 
例如 3 图 6-20 中 对 应 于 五- >E; F E, 的 语 gen(E.addr ‘=! ‘minus’ E,.addr); } 


义 规则 直接 调用 gen 产生 一 条 加 法 指令 。 
在 此 之 前 ， 翻 译 方案 已 经 生成 了 计算 E 
的 值 并 放 人 Ey. addr、 计算 E, 的 值 并 放 | id { B.addr = top.gei(id lexeme); } 
A Ez. addr 的 指令 序列 。 = 

图 6-20 的 方法 也 可 以 用 来 构造 语法 R 6-20 ” 增 量 生成 表达 式 的 三 地 址 代码 
树 ， 对 应 于 ESE, +E, 的 语义 动作 使 用 构造 算 子 生成 新 的 结 点 。 规 则 如 下 : 

E-+E, + E, | E. addr = new Node('+', E,. addr, E,. addr); | 

这 里 , 属性 addr 表示 的 是 一 个 结 点 的 地 址 ,而 不 是 某 个 变量 或 常量 。 


| CE) { E.addr = Ey.addr; } 














O 在 语法 制导 定义 中 ，sen 构造 出 一 条 指令 并 返回 它 。 在 翻译 方案 中 ，&en 构造 出 一 条 指令 ,并 增 量 地 将 它 添加 到 
令 流 中 去 。 
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6.4.3 数组 元 素 的 寻 址 
将 数组 元 素 存 储 在 一 块 连续 的 存储 空 一 个 具 
有 空 个 元 素 的 数组 中 的 元 素 是 按照 0, 1,…, n -1 编号 的 。 假 设 每 个 数组 元 素 的 宽度 是 w, 那么 
数组 4 的 第 i 个 元 素 的 开始 地 址 为 





base +i Xw (6.2) 
其 中 base 是 分 配给 数组 4 的 内 存 块 的 相对 地 址 。 也 就 是 说 , base 是 4[0] 的 相对 地 址 。 

式 (6.2) 可 以 被 推广 到 C 语言 中 的 二 维 或 多 维 数组 上 。 对 于 二 维 数组 , 我 们 在 C 中 用 
Alili l ERRE i THR i 个 元 素 。 假 设 一 行 的 宽度 是 w , 同一 行 中 每 个 元 素 的 宽度 是 wy. 
A[ 记 Lis] 的 相对 地 址 可 以 使 用 下 面 的 公式 计算 

base +i; Xw] +i, Xw (6.3) 
对 于 上 维 数组 , 相应 的 公式 为 
base +i, Xw tip Xw +0 +i, XW, (6.4) 
其 中 , wj(1<j<k) 是 对 式 (6.3) 中 的 wi 和 w 的 推广 。 
另 一 种 计算 数组 引用 的 相对 地 址 的 方法 是 根据 第 7 维 上 的 数组 元 素 的 个 数 n; 和 该 数组 的 每 
个 元 素 的 宽度 w=wi 进行 计算 。 在 二 维 数组 中 ( 即 大 =2, w=w), Ali] li BhA 


base + (iy X nz +h) Xw (6.5) 
WT A RH, 下 列 公式 计算 得 号 到 的 地 址 和 公式 (6.4) 所 得 到 的 地 址 相同 ， 
base + ( (= ( (ii Xna tig) Xna +3) ++) Xn, +i) Xw (6.6) 


在 更 一 般 的 情况 下 ， 要 下 标 并 不 一 定 是 从 0 开始 的 。 在 一 个 一 维 数组 中 ,数组 元 素 的 编号 方 
式 如 下 : low, low +1,: ee 而 sase 是 4[owj 的 相对 地 址 。 讨 算 4[ 局 的 地 址 的 式 (6.2) 就 变 成 ; 
base + (i — low) x w (6.7) 

式 (6.2) 和 式 (6.7) 都 可 以 改写 成 ixw +c 的 形式 , 其 中 的 子 表达 式 = base -low xw 可 以 在 
编译 时 刻 预 先 计算 出 来 。 请 注意 ， 当 low 为 0 时 c= base。 我 们 假定 c 被 存放 在 4 对 应 的 符号 表 条 
EF, 那么 只 要 把 ixw 加 到 < 上 就 可 以 计算 得 到 4[i 的 相对 地 址 。 

编译 时 刻 的 预先 计算 同样 可 以 应 用 于 多 维 数组 元 素 的 地 址 计算 , 见 练习 6.4.5, Ki, 有 一 
种 情况 下 我 们 不 能 使 用 编译 时 刻 预先 计算 的 技术 : 当 数 组 大 小 是 动态 变化 的 时 候 。 如 果 我 们 在 
编译 时 刻 无 法 知道 low 和 high( 或 者 它们 在 多 维 数组 情况 下 的 泛 化 ) 的 值 , 我 们 就 无 法 提前 计算 出 
像 c 这 样 的 常量 。 因 此 在 程序 运行 时 , 像 (6.7) 这 样 的 公式 就 需要 按照 公式 所 写 进 行 求 值 。 

上 面 的 地 址 计算 是 基于 数组 的 按 行 存放 方式 的 , C 语言 都 使 用 这 种 数据 布局 方式 。 一 个 二 维 
数组 通常 有 两 种 存储 方式 ， 即 按 行 存放 (一 行 行 地 存放 ) 和 按 列 存放 (一 列 列 地 存放 )。 图 6-21 显 
示 了 一 个 2 x3 的 数组 4 的 两 种 存储 布局 方式 , 图 6-21a 中 是 按 行 存放 方式 , 图 6-21b 中 是 按 列 存 
放 方 式 。Fortran 系列 语言 使 用 按 列 存放 方式 。 




















pi 40,1] 
第 一 列 
第 一 行 A(2,1] EA 
4[1.2] A 
aly 一 万 
Al2,2] 第 二 列 
第 二 行 A[1,3] 
a) 按 行 存放 bD) 按 列 存放 


图 6-21 二 维 数 组 的 存储 布局 
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我 们 可 以 把 按 行 存放 策略 和 按 列 存放 策略 推广 到 多 维 数组 中 。 按 行 存放 方式 的 推广 形式 按 
照 如 下 方式 来 存储 元 素 : 当 我 们 扫描 一 块 存储 区 域 时 ,就 像 汽 车 里 程 表 中 的 数字 一 样 ,最 右边 的 
下 标 变 化 最 为 频繁 。 而 按 列 存放 方式 则 被 推广 为 相反 的 布局 方式 , 最 左边 的 下 标 变 化 最 频繁 。 
6.4.4 数组 引用 的 翻译 

为 数组 引用 生成 代码 时 要 解决 的 主要 问题 是 将 6. 4. 3 节 中 给 出 的 地 址 计算 公式 和 数组 引用 
的 文法 关联 起 来 。 令 非 终结 符 号 上 生成 一 个 数组 名 字 再 加 上 一 个 下 标 表 达 式 的 序列 : 

L— L[E] | id [£] 

5 C 和 Java 中 一 样 , 我 们 假定 数组 元 素 的 最 小 编号 是 0。 我 们 使 用 式 (6.4), 基于 宽度 来 计 
算 相 对 地 址 , 而 不 是 像 式 (6.6) 中 那样 使 用 元 素 的 数量 来 计算 地 址 。 图 6-22 所 示 的 翻译 方案 为 带 
有 数组 引用 的 表达 式 生 成 三 地 址 代码 。 它 包括 了 图 6-20 中 给 出 的 产生 式 和 语义 动作 , 同时 还 包 
括 了 涉及 非 终结 符号 工 的 产生 式 。 





S > id=E; {yen(top.get(id.lereme) '=' E.addr); } 
| L=E;  { gen(L.array .base '[|' L.addr | '=' E.addr); } 


E > FE, + Es {| E.addr = new Temp (); 
gen(E.addr'=' E,.addr'+' Ey.addr); } 


| id { E.addr = top.get(id.lexeme); } 


| L { E.addr = new Temp (); 
gen B.addr'=' L.array.base '[ L.addr '}'); } 


L > id[{ E] { L.array = top.get(id lexeme); 
L.type = L.array.type.elem:; 
L.addr = new Temp (); 
gen(L.addr'=' E.addr 'x' L.type.width); } 


| Li CEJ] { Learray = L,.array; 
L.type = L,.type.elem; 
t= new Temp(); 
L.addr = new Temp (); 
gen(t'=' E.addr'x' L.type.width); 
gen(L.addr’=' Li.addr '+’ t); } 














图 6-22 处理 数组 引用 的 语义 动作 


非 终结 符号 过 有 三 个 综合 属性 : 

1) L. addr 指示 一 个 临时 变量 。 这 个 临时 变量 将 被 用 于 累加 公式 (6.4) 中 的 六 xz 项 ,从 而 
计算 数组 引用 的 偏 移 量 。 

2) L. array 是 一 个 指向 数组 名 字 对 应 的 符号 表 条 目的 指针 。 在 分 析 了 所 有 的 下 标 表达 式 之 
Ja, 该 数组 的 基地 址 , 也 就 是 L. array. base, 被 用 于 确定 一 个 数组 引用 的 实际 左 值 。 

3) L. type 是 工 生 成 的 子 数组 的 类 型 。 对 于 任何 类 型 i, 我 们 假定 其 宽度 由 t width 给 出 。 我 
们 把 类 型 (而 不 是 宽度 ) 作 为 属性 , 是 因为 无 论 如 何 类 型 检查 总 是 需要 这 个 类 型 信息 。 对 于 任何 
数组 类 型 ;, 假设 i. elem 给 出 了 其 数组 元 素 的 类 型 。 

FER Sid = E; 代表 一 个 对 非 数组 变量 的 赋值 语句 , 它 按照 通常 的 方法 进行 处 理 。 
S>L=E; 的 语义 动作 产生 了 一 个 带 下 标的 复制 指令 ， 它 将 表达 式 的 值 存放 到 数组 引用 世 所 指 
的 内 存 位 置 。 回 顾 一 下 ,属性 工 . array 给 出 了 数组 的 符号 表 条 目 。 数 组 的 基地 址 ( 即 0 号 元 素 的 
HEHE) H L. array. base A iH, EIE L. addr 表示 一 个 临时 变量 , 它 保存 了 工 生成 的 数组 引用 的 偏 移 
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量 。 因 此 , 这 个 数组 引用 的 位 置 是 上 . aray. basel L. addr]。 这 个 指令 将 地 址 天 addr 中 的 右 值 放 入 
工 的 内 存 位 置 中 。 

FEI ESE +E, 和 Eid 与 以 前 相同 。 新 的 产生 式 ESL 的 语义 动作 生成 的 代码 将 上 所 指 
位 置 上 的 值 复制 到 一 个 新 的 临时 变量 中 。 和 前 面 对 产生 式 SOL = EB; 的 讨论 一 样 ,上 所 指 的 地 址 
就 是 上 . array. base[ 上 . addr], FEA, RTE L. array 仍然 给 出 了 数组 名 ,上 . array. base 给 出 了 数组 的 
Eho RHE L. addr 表示 保存 偏 移 量 的 临时 变量 。 数 组 引用 的 代码 将 存放 在 由 基地 址 和 偏 移 量 
给 出 的 位 置 中 的 有 值 放 入 E. addr 所 指 的 临时 变量 中 。 

CR 今 。 表 示 一 个 2x3 的 整数 数组 , c、i、j 都 是 整数 。 那 么 a 的 类 型 就 是 aray(2， 
array(3 ,integer) ) 。 假 定 -一 个 整数 的 宽度 为 4, 那么 a 的 类 型 的 宽度 就 是 24。a[ i ] 的 类 型 是 or 
ray(3, integer), HH w, 为 12。a[i][j] 的 类 型 是 整 型 。 

图 6-23 给 出 了 表达 式 c + a[ i][j] 的 注释 语法 分 析 树 。 该 表达 式 被 翻译 成 图 6-24 中 给 出 的 
三 地 址 代码 序列 。 这 里 我 们 仍然 使 用 每 个 标识 符 的 名 字 来 表示 它们 的 符号 表 条 日 。 g 


E.addr = ts 


ge i 








E.addr = c E.addr = t4 
c L.array =a 
L.type = integer 
— Laddr=t3 、 
L.array=a F 区 N D = 
L.type = array(3, integer) [ E.addr = j J 7 
L.addr = ti | 
ee Z N oe j = 
a.type [ Boa =i ] 
= array(2, array(3, intege | We ， . 
y(2, array(3, integer)) ; 图 624 表达 式 c +a[ i][j] 


6-23 c+a[i][j] 的 注释 语法 分 析 树 的 三 地 址 代码 
6.4.5 6.4 节 的 练习 
练习 6. 4.1: 向 图 6-19 的 翻译 方案 中 加 入 对 应 于 下 列 产 生 式 的 规则 : 
1) EE, + E, 
2) E+E1( 单 目 加 ) 
练习 6. 4. 2: 使 用 图 6-20 中 的 增 量 式 翻译 方案 重复 练习 6.4. 1 。 
练习 6. 4. 3: 使 用 图 6-22 所 示 的 翻译 方案 来 翻译 下 列 赋值 语句 
1) x = ali] + b[j] 
2) x = ali][j] + dla) [jl 
13) x = a[lb[ij [tj]] [c[k]] 
! 练习 6. 4.4: 修改 图 6-22 中 的 翻译 方案 , 使 之 适合 Fortran 风格 的 数组 引用 ,也 就 是 说 , n 
维 数组 的 引用 为 id[ Ei, E,,…, En]. 
练习 6. 4.5; 将 公式 (6.7) 推 广 到 多 维 数组 上 , 并 指出 哪些 值 可 以 被 存放 到 符号 表 中 并 用 来 
计算 偏 移 量 。 考 虑 下 列 情况 : 
1) 一 个 二 维 数组 A, 按 行 存放 。 第 一 维 的 下 标 从 三 到 有 ,第 二 维 的 下 标 从 Ls Bl hy 。 单 个 数 
组 元 素 的 宽度 为 w。 
2) 其 他 条 件 和 1 相同 , 但 是 采用 按 列 存放 方式 。 
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13) 一 个 下 维 的 数组 A, 按 行 存放 , 元 素 宽度 为 mw, 第 j 维 的 下 标 从 14 到 hh。 

14) 其 他 条 件 和 3 相同 , 但 是 采用 按 列 存放 方式 。 

练习 6. 4. 6: 一 个 按 行 存放 的 整数 数组 ALi, 门 的 下 标 守 的 范围 为 1 ~10, 下 标 j 的 范围 为 1 ~ 
20。 每 个 整数 占 4 个 字 节 。 假 设 数组 4 从 0 字 节 开始 存放 , 请 给 出 下 列 元 烷 的 位 置 : 

1) A[4,5] 2) A[10,8] 3) 4[3, 17] 

练习 6. 4.7: 假定 4 是 按 列 存放 的 , 重复 练习 6.4.6。 

练习 6. 4. 8: 一 个 按 行 存放 的 实数 型 数组 4[i, Jj, 所 的 下 标 的 范围 为 1~4, 下 标 j 的 范围 为 
0 ~4, 且 下 标的 范围 为 5~10。 每 个 实数 占 8 个 字 节 。 假 设 数 组 4 从 0 字 节 开始 存放 。 计 算 下 
列 元 素 的 位 置 。 

1) A[3,4,5] 2)4[1,2,7] 3)4[4,3,9] 

练习 6. 4. 9: 假定 4 是 按 列 存 放 的 , 重复 练习 6.4.8。 





符号 化 表示 的 类 型 宽度 
中 间 代 码 应 该 相对 独立 于 目标 机 器 , 这 样 当 代码 生成 器 被 蔡 换 为 对 应 于 另 一 合 机 器 的 代 
码 生 成 器 时 , 优化 器 不 需要 做 出 太 大 的 改变 。 然 而 , 正如 我 们 刚刚 描述 的 类 型 宽度 计算 方法 
所 示 , 关于 基本 类 型 的 信息 被 融合 到 了 这 个 翻译 方案 中 。 例 如 , 例 6. 12 中 假定 每 个 整数 数组 
的 元 素 占 4 个 字 节 。 一 些 中 间 代 码 ,， 如 Pascal 的 P-code, 让 代码 生成 器 来 填写 数组 元 素 的 大 
小 , 因此 中 间 代 码 独立 于 机 器 的 字 长 。 只 要 用 一 个 符号 常量 来 代替 翻译 方案 中 的 (作为 整数 
类 型 宽度 的 )4, 我 们 就 可 以 在 我 们 的 翻译 方案 中 做 到 这 一 点 。 











6.5 类 型 检查 


为 了 进行 类 型 检查 (type checking), 编译 器 需要 给 源 程序 的 每 ~- 个 组 成 部 分 赋予 一 个 类 型 表 
达 式 。 然 后 , 编译 器 要 确定 这 些 类 型 表达 式 是 否 满 足 一 组 逻辑 规则 。 这 些 规 则 称 为 源 语言 的 类 
型 系统 (type system) o 
类 型 检查 具有 发 现 程序 中 的 错误 的 潜能 。 原 则 上 ， 如 果 目 标 代码 在 保存 元 素 值 的 同时 保存 
了 元 素 类 型 的 信息 , 那么 任何 检查 都 可 以 动态 地 进行 。 一 个 健全 (sound) 的 类 型 系统 可 以 消除 对 
动态 类 型 错误 检查 的 需要 , 因为 它 可 以 帮助 我 们 静态 地 确定 这 些 错 误 不 会 在 目标 程序 运行 的 时 
候 发 生 。 如 果 编 译 器 可 以 保证 它 接受 的 程序 在 运行 时 刻 不 会 发 生 类 型 错误 , 那么 该 语言 的 这 个 
实现 就 被 称 为 强 类 型 的 。 
除了 用 于 编译 , 类 型 检查 的 思想 还 可 以 用 于 提高 系统 的 安全 性 , 使 得 人 们 安全 地 导入 和 执行 
软件 模块 。Java 程序 被 编译 成 为 机 器 无 关 的 字 节 码 , 在 字 节 码 中 包含 了 有 关 字 节 码 中 的 运算 的 详 
细 类 型 信息 。 导 人 的 代码 在 被 执行 之 前 首先 要 进行 类 型 检查 ,以 防止 因 朴 忽 造 成 的 错误 和 恶意 
攻击 。 
6. 5. 1 类 型 检查 规则 i 
类 型 检查 有 两 种 形式 : 综合 和 推导 。 类 型 综合 (type synthesis) 根据 子 表 达 式 的 类 型 构造 出 表 
达 式 的 类 型 。 它 要 求 名 字 先 声明 再 使 用 。 表 达 式 E +E, 的 类 型 是 根据 E AVE, 的 类 型 定义 的 。 
一 个 与 迎 的 类 型 综合 规则 具有 如 下 形式 : ， 
站 /的 类 型 为 ;--1 且 x 的 类 型 为 : 
then 表达 式 f(x) 的 类 型 为 
这 里 ,了 和 x 表示 表达 式 , Ms- 表示 从 ;到 1 的 函数 。 这 个 针对 单 参数 函数 的 规则 可 以 推广 到 带 


(6. 8) ， 
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有 多 个 参数 的 亢 数 。 只 要 稍 做 修改 ,规则 (6. 8 ) 就 可 以 用 于 E +), 我们 只 需要 把 它 看 作 一 个 阔 
数 应 用 add( E, , Ea) AAT O. 

类 型 推导 (type inference) 根据 一 个 语言 结构 的 使 用 方式 来 确定 该 结构 的 类 型 。 先 看 一 下 
6.5.4 节 中 的 例子 , 令 null 是 一 个 测试 列表 是 否 为 空 的 函数 。 那 么 ,根据 这 个 函数 的 使 用 null (x) , 
我 们 可 以 指出 x 必须 是 一 个 列表 类 型 。 列 表 x 中 的 元 素 类 型 是 未 知 的 , 我 们 所 知道 的 全 部 信息 
是 : x 是 一 个 列表 类 型 ， 其 元 素 类 型 当前 未 知 。 

代表 类 型 表达 式 的 变量 使 得 我 们 可 以 考虑 未 知 类 型 。 我 们 可 以 用 希腊 字母 a、B 等 作为 类 型 
表达 式 中 的 类 型 变量 。 

一 个 典型 的 类 型 推导 规则 具有 下 面 的 形式 : 


fN) ESRAR, (6.9) 
then 对 某 些 a ALB, /的 类 型 为 ap 且 的 类 型 为 a 
在 类 似 ML 这 样 的 语言 中 需要 进行 类 型 推导 。ML 语言 会 检查 类 型 , 但 是 不 需要 对 名 字 进 行 


声明 。 

在 本 节 中 , 我 们 考虑 表达 式 的 类 型 检查 。 检 查 语 名 的 规则 和 检查 表达 式 类 型 的 规则 类 做 。 
例如 , 我 们 可 以 把 条 件 语句 “站 (E) S; AEX E A SAR if HR, SRSA! void 表示 没有 
值 的 类 型 , 那么 六 函数 将 被 应 用 在 一 个 布尔 型 和 一 个 void 型 的 对 象 上 。 此 函数 的 结果 类 型 是 
void o 
6.5.2 类 型 转换 

考虑 类 似 于 x+i 的 表达 式 , 其 中 * 是 浮 点 数 类 型 而 i 是 整 型 。 因 为 整数 和 浮 点 数 在 计算 机 中 
有 不 同 的 表示 形式 ， 而 且 使 用 不 同 的 机 器 指令 来 完成 整数 和 浮 点 数 运算 。 编 译 器 需要 把 + 的 某 
个 运算 分 量 进行 转换 ， 以 保证 在 进行 加 法 运算 时 两 个 运算 分 量具 有 相同 的 类 型 。 

假定 在 必要 的 时 候 可 以 使 用 一 个 单 目 运算 符 ( float ) 将 整数 转换 成 浮 点 数 。 例 如 , 整数 2 
在 表达 式 2*3.14 对 应 的 代码 中 被 转换 成 浮 点 数 : 


tı = (float) 2 
te = ti * 3.14 


我 们 可 以 扩展 这 样 例子 , 考虑 运算 符 的 整 型 和 浮 点 型 版 本 。 比 如 ，int * 表示 作用 于 整 型 运 
算 分 量 的 运算 符 , 而 float * 表示 作用 于 浮 点 型 运算 分 量 的 运算 符 。 

我 们 将 扩展 6.4.2 节 中 的 用 于 表达 式 翻译 的 翻译 方案 ,以 说 明 如 何 进 行 类 型 综合 。 我 们 引入 
男 一 个 属性 E. type, 该 属性 的 值 可 以 是 integer 或 float。 和 EE + Ey 相关 的 规则 可 用 如 下 的 伪 
代码 给 出 : 

if ( E type = integer and bo.type = integer) E.type = integer, 

else if ( El.type = float and E .type = integer) ->> 

随 着 需要 转换 的 类 型 的 增多 ,需要 处 理 的 不 同情 况 也 急剧 增多 。 因 此 , 在 处 理 大 量 的 类 型 
时 , 精心 组 织 用 于 类 型 转换 的 语义 动作 就 变 得 非常 重要 。 

不 同 语言 具有 不 同 的 类 型 转换 规则 。 图 6-25 中 的 Java 的 转换 规则 区 分 了 拓宽 ( widening) 转 
BANE 10 (narrowing) 转换。 拓宽 转换 可 以 保持 原 有 的 信息 , 而 罕 化 转换 则 可 能 丢失 信息 。 拓 宽 
规则 通过 图 6-25a 中 的 层次 结构 给 出 : 在 该 层次 结构 中 位 于 较 低层 的 类 型 可 以 被 拓宽 为 较 高 层 的 
类 型 。 因 此 ,char 类 型 可 以 被 拓宽 为 int 型 和 float HY, 但 是 不 可 以 被 拓宽 为 short 类 型 。 罕 化 转换 








他 “即使 我 们 在 确定 类 型 时 需要 某 些 上 下 文 信息 ,我们 仍 将 使 用 "综合 "这 个 术语 。 使 用 重 载 函 数 时 (多 个 函数 可 能 被 
赋予 同一 个 名 字 ) , 在 某 些 语言 中 , 我 们 还 需要 考虑 El +E, 的 上 下 文才 能 确定 其 类 型 规则 。 
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的 规则 如 图 6-25b 所 示 : 如 果 存 在 一 条 从 * 到 上 的 路 径 , 则 可 以 将 类 型 * 窗 化 为 类 型 :。 可 以 看 出 ， 


char, short, byte 之 间 可 以 两 两 相互 转换 。 double double 
如 果 类 型 转换 由 编译 器 自动 完成 , 那么 这 样 的 
转换 就 称 为 隐 式 转换 。 隐 式 转换 也 称 为 自动 类 型 “| r 
转换 (coercion) 。 在 很 多 语言 中 ,自动 类 型 转换 仅 long long 
仅 限于 拓宽 转换 。 如 果 程序 员 必 须 写 出 某 些 代码 | A, 
来 引发 类 再 转换 运算 ,那么 这 个 转换 就 称 为 显 式 “A N oe 
的 。 显 式 转换 也 称 为 强制 类 型 转换 (east) o T A aaa ees 
检查 ESE, +E, 的 语义 动作 使 用 了 两 个 函数 : bye 
1) max( DRZ i Ay 两 个 类 型 的 参数 ， » 拓宽 类 型 转换 - b) 窗 化 类 型 转换 
并 返回 拓宽 层次 结构 中 这 两 个 类 型 中 的 最 大 者 (或 图 6-25 Java 中 简单 类 型 的 转换 


者 最 小 上 界 )。 如 果 i hy 之 一 没有 出 现在 这 个 
层次 结构 中 ,比如 有 个 类 型 是 数组 类 型 或 指针 类 型 , 那么 该 函数 返回 一 个 错误 信息 。 
2) 如 果 需 要 将 类 型 为 上 的 地 址 a 中 的 内 容 转换 成 











w 类 型 的 值 , 则 函数 widen(a, bu) 将 生成 类 型 转换 的 | 和” SIMARD a Tune by Tine w) 
代码 。 如 果 : 和 w 是 相同 的 类 型 , 则 该 函数 返回 a 本 ee ony 
身 。 否则 ， 它 会 生成 一 条 指令 来 完成 转换 工作 并 将 转 gen(temp '=' (float)! a); 
换 结果 放置 到 临时 变量 temp 中 。 这 个 临时 变量 将 作为 全 
结果 返回 。 函 数 widen 的 伪 代 码 如 图 6-26 所 示 , ix else error; 
假设 只 有 integer 和 float 两 种 类 型 。 } 

图 6-27 中 EE, + E, 的 语义 动作 说 明了 如 何 把 图 6-26 widen 函数 的 伪 代 码 


类 型 转换 加 入 到 图 6-20 所 示 的 翻译 表达 式 的 方案 中 。 

在 这 个 语义 动作 中 , WR E 的 类 型 不 需要 被 转换 成 的 类 型 , 那么 临时 变量 a, 就 是 E. addr, 
如 果 需 要 进行 这 样 的 转换 , 则 a, 就 是 widen 函数 返回 的 一 个 新 的 临时 变量 。 类 似 地 , a, 可 能 是 
E, addr, 也 可 能 是 一 个 新 交 时 变量 , 用 于 存放 转换 后 的 E 的 值 。 如 果 两 个 变量 都 是 整 型 或 者 都 
EFAN, 就 不 需要 进行 任何 转换 。 我 们 会 发 现 , 将 两 个 不 同类 型 的 值 相 加 的 唯一 方法 是 把 它们 
都 转换 成 为 第 三 种 类 型 。 





E -= E+E, { E.type = maz(E.type, Ey.type); 
a, = widen(E,.addr, E,.type, E.type): 
a, = widen(Ey.addr, Ex.type, E.type); 
E.addr = new Temp (): 
gen(E.addr = a; '+' a2): } 











图 6-27 在 表达 式 求 值 中 引入 类 型 转换 


6.5.3 函数 和 运算 符 的 重 载 

依据 符号 所 在 的 上 下 文 不 同 , 被 重 载 (overloaded ) 的 符号 会 有 不 同 的 含义 。 如 果 能 够 为 一 个 
名 字 的 每 次 出 现 确定 其 唯一 的 含义 , 该 名 字 的 重 载 问 题 就 得 到 了 解决 。 在 本 节 中 , 我 们 仅 考虑 那 
些 只 需要 查看 函数 参数 就 能 解决 的 函数 重 载 。java 中 的 重 载 即 是 如 此 。 
[根据 其 运算 分 量 的 类 型 ，Java 中 的 + 运算 符 既 可 以 表示 字符 串 的 连接 运算 , 也 可 以 表 
示 加 法 运算 。 用 户 自 定义 的 函数 同样 可 以 重 裁 ,例如 
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请 注意 ,我 们 可 以 根据 函数 err 的 参数 来 确定 选择 该 函数 的 哪 一 个 版 本 。 g 
F E EN AT E aR A BY HS LI : 
让 /可 能 的 类 型 为 si(1<ign), 其 中 , ss (ij) 
and x 的 类 型 为 (1 <k<n) (6. 10) 
then 表达 式 f(x) 的 类 型 为 t 
6.1.2 节 中 的 值 编码 方法 同样 可 以 用 于 类 型 表达 式 ， 以 便 根据 参数 类 型 高 效 地 解决 重 载 问 
题 。 在 表示 类 型 表达 式 的 一 个 DAG k, 我 们 给 每 个 结 点 赋予 一 个 被 称 为 值 编码 的 整数 序号 。 使 
用 算法 6.3, 我 们 可 以 构造 出 每 个 结 点 的 范 型 , 该 范 型 由 该 结 点 的 标号 及 其 从 左 到 右 的 子 结 点 的 
值 编码 组 成 。 一 个 了 汕 数 的 范 型 由 其 函数 名 和 它 的 参数 的 类 型 组 成 。 根 据 函 数 的 参数 类 型 解决 重 
载 的 问题 就 等 价 于 基于 范 型 解决 重 形 的 问题 。 
仅仅 通过 查看 一 个 消 数 的 参数 类 型 不 一 定 能 够 解决 重 载 问题 。 在 Ada H, 一 个 子 表达 式 会 
有 一 组 可 能 的 类 型 , 而 不 是 只 有 一 个 确定 的 类 型 。 它 所 在 的 上 下 文 必须 提供 足够 的 信息 来 缩小 
可 选 范 围 , 最 终 得 到 唯一 的 可 选 类 型 ( 见 练习 6. 5.2) 。 
6.5.4 类 型 推导 和 多 态 函 数 
类 型 推导 常用 于 像 ML 这 样 的 语言 。ML 是 一 个 强 类 型 语言 , 但 是 它 不 要 求 名 字 在 使 用 前 先 
进行 声明 。 类 型 推导 保证 了 名 字 使 用 的 一 致 性 。 
术语 “多 态 " 指 的 是 任何 可 以 在 不 同 的 参数 类 型 上 运行 的 代码 片段 。 在 本 节 中 , 我 们 考虑 参 
4 $ A (parametric polymorphism) ,这 种 多 态 通过 参数 和 类 型 变量 来 刻 划 。 我 们 使 用 图 6-28 中 的 
ML 程序 作为 一 个 贯穿 本 节 的 例子 。 该 程序 定义 了 一 个 函数 length, REL length 的 类 型 可 以 描述 
为 :“ 对 于 任何 类 型 a，length 函数 将 元 素 类 型 为 a 的 列表 映射 为 整 型 ”。 
| | 


fun length(z) = 
if null(x) then 0 else length(tx)) + 1; 

















图 6-28 ”计算 一 个 列表 长 度 的 ML 程序 





ASE 在 图 6-28 中 , XEF fun 引出 了 一 个 函数 定义 , 被 定义 的 函数 可 以 是 递归 的 。 这 个 程 
序 片段 定义 了 带 有 单个 参数 x 的 函数 length。 这 个 函数 的 函数 体 包含 了 一 个 条 件 表 达 式 。 预 定义 
的 函数 null 测试 一 个 列表 是 否 为 空 。 预 定义 函数 (tail 的 缩写 ) 移 除 列表 中 的 第 一 个 元 素 , 然后 
返回 列表 的 余下 部 分 。 

函数 length 确定 一 个 列表 * MIKE, 或 者 说 x 中 元 素 的 个 数 。 列 表 中 的 所 有 元 素 必 须 具 有 相 
同 的 类 型 。 不 管 列表 元 素 是 什么 类 型 ,都 可 以 用 length 项 数 来 求 出 这 个 列表 的 长 度 。 在 下 面 的 表 
达 式 中 ，ieng 坟 被 应 用 到 两 种 不 同类 型 的 列表 中 (列表 元 素 用 “[ M " 括 起 来 ) : 





length([ "sun", "mon" , "tue" ]) +length( |10, 9, 8, 7]) (6.11) 

字符 囊 列表 的 长 度 为 3, 整数 列表 的 长 度 为 4, 因此 表达 式 (6. 11) 的 值 为 7。 口 
使 用 符号 V ( 读 作 “对 于 任意 类 型 ” ) 以 及 类 型 构造 算 子 list, length 的 类 型 可 以 写作 : 

V a. list (a) integer (6. 12) 

符号 V 是 全 称 量词 (wiversal quantifier) , 它 所 作用 的 类 型 变量 称 为 受 限 的 (bound) 。 受 限 变量 可 以 

被 任意 地 重 命名 , 但 是 需要 把 这 个 变量 的 所 有 出 现 一 起 重 命 名 。 因 此 ,类 型 表达 式 


VB. list(B) integer 和 式 (6. 12) 等 价 。 其 中 带 有 VY 符号 的 类 型 表达 式 被 称 为 “ 岁 态 类 型 ”。 
在 多 态 函 数 的 各 次 应 用 中 ， 函数 的 受 限 的 类 型 变量 可 以 表示 不 同 的 类 型 。 在 类 型 检查 中 , 每 
次 使 用 多 态 类 型 时 , 我 们 将 受 限 变量 替换 为 新 的 变量 , 并 去 掉 相 应 的 全 称 量词 。 
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下 一 个 例子 对 length 类 型 进行 了 非 正式 的 推导 , 推导 过 程 中 隐 式 地 使 用 了 公式 (6.9) 中 的 推 
导 规 则 。 这 里 再 重复 一 下 ; 
站 fx) 是 一 个 表达 式 
then 对 某 些 c FUB, f KRA ap Bx 的 类 型 为 a 
图 6-29 中 的 抽象 语法 树 表示 图 6-28 中 对 length 的 定义 。 这 棵 树 的 根 的 标号 为 fun, 








例 6.15 





它 表示 函数 定义 。 其 他 的 非 叶 子 结 点 可 以 看 作 是 函数 应 用 。 on 
标号 为 + 的 结 点 表示 对 两 个 子 结 点 应 用 运算 符 o XM, enk i 
标号 为 让 的 结 点 表示 将 运算 符 并 应 用 于 它 的 三 个 子 结 点 组 成 m 3) 
的 三 元 组 上 (对 于 类 型 检查 ,究竟 是 then 分 支 还 是 else 分 支 aie OS eae ia 
被 求 值 并 不 是 问题 。 它 们 不 会 被 同时 计算 ) 。 AR 
我 们 可 以 根据 函数 length 的 函数 体 推导 出 它 的 类 型 。 从 length Op 
左 到 右 考 虑 标号 为 证 的 结 点 的 子 结 点 。 因 为 null 要 被 应 用 在 i 闪 
列表 上 ,所 以 * 必须 是 一 个 列表 。 我 们 使 用 变量 a 作为 列表 6-29 图 6-28 中 的 函数 定义 
元 素 类 型 的 占 位 符 , 也 就 是 说 ,x 的 类 型 为 a 的 列表 "。 对 应 的 抽象 语法 分 析 树 


如 果 null(x) AA, 则 length) 0. Ait, length 的 类 型 一 定 是 “从 ca 的 列表 到 整 型 的 函 
数 ”。 这 个 推导 得 到 的 类 型 和 在 else 4} 3% length (tlla) ) +1 中 对 length 的 使 用 是 一 致 的 。 口 

因为 在 类 型 表达 式 中 可 能 出 现 变量 , 所 以 我 们 必须 重新 审视 一 下 类 型 等 价 的 概念 。 设 想 将 
类 型 为 s>s HI E, 应 用 到 类 型 为 1 的 5, 上。 我 们 不 能 简单 地 确定 s 和 1 RBS, 而 是 必须 将 这 
两 种 类 型 “ 合 一 ”。 非 正式 地 讲 , 我 们 将 确定 是 否 可 以 将 类 型 变量 s 和 上 替换 为 特定 的 类 型 表达 
sh, 从 而 使 得 s 和 1 在 结构 上 等 价 。 

置 搁 (substitution) 是 一 个 从 类 型 变量 到 类 型 表达 式 的 映射 。 我 们 把 对 类 型 表达 式 1 中 的 变量 
应 用 置换 S 后 得 到 的 结果 写作 SO), 详细 信息 请 参见 “ 置换、 实例 和 合 一 ”部 分 。 两 个 类 型 表达 
ZK ty Alt, 可 以 会 一 (unify) 的 条 件 是 存在 某 个 置换 S 使 得 5(t) ) =5(1,)。 在 实践 中 , 我 们 感 兴趣 
的 是 最 一 般 化 的 合 一 置换 , 这 种 合 一 置换 对 表达 式 中 的 变量 施加 的 约束 最 少 。6. 5.5 节 给 出 了 一 
个 合 一 算法 。 





置换 、 实 例 和 合 一 

如 果 是 一 个 类 型 表达 式 , AS 是 一 个 置换 ( 即 一 个 从 类 型 变量 到 类 型 表达 式 的 映射)， 
那么 我 们 用 S(1) 来 表示 将 i 中 的 每 个 类 型 变量 a 的 所 有 出 现 替换 为 S(a) 后 得 到 的 结果 。 
5(1) 被 称 为 1 的 一 个 实例 (instance)。 例 如 ,lisi(integer) 是 lisi(a) 的 一 个 实例 , 因 为 它 是 将 list . 
(a) 中 的 a 替换 为 integer 后 的 结果 。 然 而 , 请 注意 integer—floa 不 是 aca 的 实例 , 因为 置换 
必须 将 a 的 所 有 出 现 蔡 换 为 相同 的 类 型 表达 式 。 

对 于 类 型 表达 式 1) Al ty, WRS) = S(t), MARRS 就 是 一 个 合 一 替换 (unifier) 。 
如 果 对 于 与 Ale, 的 任何 合 一 替换 ， 比 如 说 S$ ,下面 的 条 件 成 立 : ITERA, SU) SO) 
的 一 个 实例 , 那么 我 们 就 说 5 是 1 Mt, 的 最 一 般 化 的 合 一 替换 (most general unifier) o HA 
说 , S 对 4 施加 的 限制 比 8 施 加 的 限制 更 多 。 

















输入 : 一 个 由 一 系列 函数 定义 以 及 紧 跟 其 后 的 待 求 值 表达 式 组 成 的 程序 。 一 个 表达 式 由 
个 函数 应 用 利 名 字 构 成 。 这 些 名 字 具 有 预定 义 的 多 态 类 型 。 - 
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输出 : 推导 出 的 程序 中 名 字 的 类 型 。 
方法 : 为 简单 起 见 ,我们 只 考虑 一 元 函数 。 对 于 带 有 两 个 参数 的 函数 所 zl , x), 我 们 可 以 将 
其 类 型 表示 为 % x sz， 其 中 si Al sy AE x) May 的 类 型 ,而 1 是 函数 f(x ,xz ) 的 结果 类 型 。 
通过 检查 s 是 否 和 的 类 型 匹配 ,ss 是 否 和 的 类 型 匹配 ,就 可 以 检查 表达 式 f(a,，6b) 的 类 型 。 
检查 输入 序列 中 的 函数 定义 和 表达 式 。 当 一 个 函数 在 其 后 的 表达 式 中 被 使 用 时 ,就 使 用 推 
导 得 到 的 该 函数 的 类 型 。 
。 对 一 个 函数 定义 fun id; (id, ) =E, 创建 一 个 新 的 类 型 变量 a 和 B。 将 函数 id, 与 类 型 
a 一 B 相 关联 ,参数 id, 和 类 型 a 相关 联 。 然 后 ,推导 出 表达 式 的 类 型 。 假 设 在 对 进 
行 类 型 推导 之 后 , a 表示 类 型 * 而 B 表示 类 型 !。 推 导 得 到 的 函数 idi HAURE s-o 
， 用 VvV 量 词 来 限制 *-* 中 任何 未 受 约束 的 类 型 变量 。 
e 对 于 函数 应 用 E (Ey), 推导 出 El 和 Es 的 类 型 。 因 为 Ei 被 用 作 一 个 函数 , 它 的 类 型 一 
ERA s-*s' 的 形式 (从 技术 上 来 说 , Ei 的 类 型 必须 和 py 合 一 , 其 中 有 和 7 是 新 的 类 型 
变量 ) 。 假 定 推导 得 到 的 E, 的 类 型 为 :。 对 s 和 4 进行 合 一 处 理 。 如 果 合 一 失败 , 表达 式 
返回 类 型 错误 , 否则 推导 得 到 的 E (E) 的 类 型 为 %。 
。 对 一 个 多 态 函 数 的 每 次 出 现 ,: 将 它 的 类 型 表达 式 中 的 受 限 变量 蔡 换 为 互 不 相同 的 新 变量 ,并 
移 除 Y 量 词 。 蔡 换 得 到 的 类 型 表达 式 就 是 这 个 多 态 函 数 的 本 次 出 现 所 对 应 的 推导 类 型 。 
。 对 于 第 一 次 磁 到 的 变量 , 引 人 一 个 新 的 类 型 变量 来 代表 它 的 类 型 。 
HAU 在 图 6-30 H, 我们 为 函数 lengih 推导 出 一 个 类 型 。 图 6-29 中 语法 树 的 根 表 示 一 个 函 
数 定义 ,因此 我 们 引入 变量 B 和 y, 并 将 类 型 By 关联 到 函数 length, 将 B 关联 到 x。 见 图 6-30 
的 1~2 行 。 
在 根 的 右 子 结 点 上 , 我 们 把 站 看 作 一 个 应 用 到 三 元 组 上 的 多 态 函 数 , 这 个 三 元 组 包括 一 个 布 
尔 型 变量 以 及 两 个 分 别 代表 then 和 else 分 支 的 表达 式 。 函 数 庆 的 类 型 是 Va. boolean x a xaa, 
多 态 函 数 的 每 次 应 用 可 能 作用 于 不 同 的 类 型 ,因此 我 们 构造 一 个 新 的 临时 变量 ai(i 取 自 
I), 并 移 除 V ， 见 图 6-30 中 的 第 三 行 。 函 数 证 的 左 子 结 点 的 类 型 必须 和 boolean 类 型 合 一 , 其 他 
两 个 子 结 点 的 类 型 必须 和 a; 合 一 。 












































行 表达 式 : 类 型 合 一 
1) length : B> y 
2) 人 
3) if : boolean x aj X ai > Qi 
4) null : list(an) 一 boolean 
5) null(x) : boolean listlan) = 8 
6) 0 : integer ai = integer 
7) + : integer x integer + integer 
8) tl : list(a,) > list(ar) 
9) t(x) : list(es) list(a,) = list(an) 
10) length(tx)) : 7 Y= integer 
11) 1 : integer 
12) | length(tl(x)) +1 : integer 
13) if( ... ) : integer 
6-30 ”推导 图 6-28 中 的 函数 length 的 类 型 


null) 来 蔡 换 受 限 变量 o, 见 第 4 行 。 因 为 mull 被 应 用 于 x, 我 们 推导 出 4 的 类 型 B 必须 和 list(a) 
匹配 ， 见 第 5 行 。 
往 站 的 第 一 个 子 结 点 上 , null(x) 的 类 型 boolean Al if RACH ASS FAVE. FEB AP FA 
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AL, 类 型 a; 与 integer 进行 合 一 ， 见 第 6 行 。 
现在 考虑 子 表达 式 jenrg 坟 (4U(xz) ) +1。 我 们 为 女 类 型 中 的 约束 变量 a 建立 新 的 临时 变量 a, ( 其 
中 :表示 "tail” ), 见 第 8 行 。 ABR d(x) OO, 我 们 推导 出 Ito) = B=Uist(a,), 见 第 9 行 。 
因为 length((x) ) 是 + 的 一 个 运算 分 量 , 它 的 类 型 y 必须 和 integer 合 一 ， 见 第 10 行 。 可 以 
推出 length 的 类 型 为 listi( a, ) 一 integer。 在 检查 完 这 个 函数 定义 之 后 ,类 型 变量 a, 仍然 保留 在 
length 的 类 型 中 。 因 为 没有 对 a, 作出 任何 假设 , 当 使 用 该 函数 时 a 可 以 被 蔡 换 为 任何 类 型 。 因 
E, 我 们 可 以 把 它 变 成 一 个 受 限 变量 , 并 把 length 的 类 型 写作 


Van list( a, ) integer 











6.5.5 一 个 合 一 算法 8 

非 正式 地 讲 , 合 一 就 是 判断 能 否 通过 将 两 个 表达 式 * 和 1 中 的 变量 蔡 换 为 某 些 表达 式 , 使 得 ， 
Ale 相同。 测试 表达 式 是 否 等 价 是 合 一 的 一 个 特殊 情况 。 如 果 s 和 :上 中 只 有 常量 没有 变量 , 则 s 和 
! 合 一 当 且 仅 当 它们 完全 相同 。 本 节 中 的 合 一 算法 可 以 处 理 含有 环 的 图 , 因此 它 可 以 用 于 测试 循 
环 类 型 的 结构 等 价 性 9 。 

我 们 将 实现 一 种 基于 图 论 表 示 方法 的 合 一 算法 , 其 中 类 型 被 表示 成 图 的 形式 。 类 型 变量 用 
叶子 结 点 表示 ， 类 型 构造 算 子 用 内 部 结 点 表示 。 结 点 被 分 成 若干 的 等 价 类 。 如 果 两 个 结 点 在 同一 
个 等 价 类 中 ，, 那么 它们 代表 的 类 型 表达 式 就 必须 合 一 。 因 此 ， 同 一 个 等 价 类 中 的 内 部 结 点 必须 具 
有 同样 的 类 型 构造 算 子 ， 且 它们 的 对 应 子 结 点 必须 等 价 。 

芳 注 国 考虑 下 列 两 个 类 型 表达 式 
( (aya, ) x list( ea) )list( a>) 


( (az =a) x list( a3 ) ) Os 


下 列 的 置换 5 是 这 两 个 表达 式 的 最 一 般 化 的 合 一 替换 : 


x S(x) 
Ql Ql 
a a 
a3 ay 
a4 az 
Qs list ( ay ) 


这 个 置换 将 上 述 两 个 类 型 表达 式 映射 成 如 下 的 表达 式 
( (aya, ) x list( a; ) ) list (az) 


这 两 个 表达 式 被 表示 为 图 6-31 中 标号 为 一 : 1 的 两 个 结 点 。 结 点 上 的 整数 编号 指明 了 在 编号 为 1 








的 结 点 被 合 一 后 , 各 个 结 点 所 属 的 等 价 类 的 编号 。 口 
:1 :1 
ZON ~ N 
2 list: 8 x:2 a5 :8 

fe x 

一 :3 list: 6 3:3 tst: 6 
~ Si. fe 

Ci Ca2 agid a4: 5 


图 6-31 合 一 后 的 等 价 类 





© 在 有 些 应 用 中 , 对 一 个 变量 和 一 个 包含 该 变 最 的 表达 式 进 行 合 一 是 错误 的 。 算 法 6. 19 允许 这 种 替换 。 
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Bea, 类 型 图 中 的 一 对 结 点 的 合 一 处 理 。 
输入 : 一 个 表示 类 型 的 图 ， 以 及 需要 进行 合 一 处 理 的 结 点 对 m 和 no 
输出 : 如 果 结 点 m 和 表示 的 表达 式 可 以 合 一 , 返回 布尔 值 rue。 反 之 , 返回 false, 
方法 : 结 点 用 一 个 记录 实现 , 记录 中 的 字段 用 于 存放 一 个 二 元 运算 符 和 分 别 指向 其 左右 子 结 
点 的 指针 。 字 段 set 用 于 保存 等 价 结 点 的 集合 。 每 个 等 价 类 都 有 一 个 结 点 被 选 作 这 个 类 的 唯一 代 
表 , CH set 字段 包含 一 个 空 指针 。 等 价 类 中 其 他 结 点 的 set 字段 (可 能 通过 该 集合 中 的 其 他 结 点 
间接 地 ) 指 向 该 等 价 类 的 代表 结 点 。 在 初始 时 刻 , 每 个 结 点 n 自身 组 成 一 个 等 价 类 , n 是 它 自己 
的 代表 结 点 。 
如 图 6-32 所 示 的 合 一 算法 在 结 点 上 进行 如 下 两 种 操作 : 
e find(n) 返 回 当前 包含 结 点 n 的 等 价 类 的 代表 结 点 。 
© union(m, n) 将 包含 结 点 m 和 nn 的 等 价 类 合并 。 如 果 m 和 所 对 应 的 等 价 类 的 代表 结 点 
中 有 一 个 是 非 变量 的 结 点 , 则 union 将 这 个 非 变 量 结 点 作为 合并 后 的 等 价 类 的 代表 结 点 ; 
BM, union 把 任意 一 个 原 代表 结 点 作为 新 的 代表 结 点 。 这 种 在 union 的 规约 中 的 非 对 称 
性 非常 重要 ， 因 为 如 果 一 个 等 价 类 对 应 于 一 个 带 有 类 型 构造 算 子 的 类 型 表达 式 或 基本 类 
型 ,我们 就 不 能 用 一 个 变量 作为 该 等 价 类 的 代表 。 否 则 , 两 个 不 等 价 的 表达 式 可 能 会 通 
过 该 变量 被 合 一 。 





boolean unify( Node m, Node n) { 

s = find(m); t = find(n); 

if ( s =t ) return true; 

else if (G4 5 和 上 上 表示 相同 的 基本 类 型 ) return true; 

else if (s2—7 #4 $45 B51 Also op-44 4 and 

te PHB TSR Alef opi) { 

union(s, t); 
return unify(sı, tı) and unify(so, te): 

} 

else f(s 或 者 表示 一 个 变量 ){ 
union(s, t); 


return true; 


else return false; 











图 6-32 合 一 算法 


集合 的 union 操作 的 实现 很 简单 ， 只 需要 改变 一 个 等 价 类 的 代表 结 点 的 set 字段 , 使 之 指向 另 
一 个 等 价 类 的 代表 结 点 即 可 。 为 了 找到 一 个 结 点 所 属 的 等 价 类 ,我 们 沿 着 各 个 结 点 的 set 字段 中 
的 指针 前 进 , 直到 到 达 代 表 结 点 ( 即 set 字段 指针 为 空 指针 的 结 点 ) 为 止 。 

请 注意 , 图 6-32 中 的 算法 分 别 使 用 s =find(m) 和 14=find(n)，, 而 不 是 直接 使 用 m 和 n。 如 果 
m 和 nn 在 同一 个 等 价 类 中 , 那么 代表 结 点 s 和 i 相等。 如果 s 和 上 表示 相同 的 基本 类 型 ， 则 调用 
unify(m, n) 返 回 irue。 如 果 s 和 上 都 是 代表 某 个 二 目 类 型 构造 算 子 的 内 部 结 点 , 那么 我 们 尝试 合 
并 它们 的 等 价 类 , 并 递归 地 检查 它们 的 各 个 子 结 点 是 否 等 价 。 因 为 首先 进行 合并 操作 , FATE 
归 检 查 子 结 点 之 前 减少 了 等 价 类 的 个 数 , 因此 算法 终止 。 

将 一 个 变量 置换 为 一 个 表达 式 的 实现 方法 如 下 : 把 代表 该 变量 的 叶子 结 点 加 入 到 代表 该 表 
达 式 的 结 点 所 在 的 等 价 类 中 。 假 设 mn 或 n 表示 一 个 变量 的 叶子 结 点 , 同时 假设 这 个 结 点 已 经 放 
人 满足 下 面条 件 的 等 价 类 中 , 即 这 个 等 价 类 中 的 一 个 结 点 代表 的 表达 式 或 者 带 有 一 个 类 型 构造 
BF, 或 者 是 一 个 基本 类 型 。 那 么 find 将 会 返回 一 个 反映 该 类 型 构造 算 子 或 基本 类 型 的 代表 结 
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点 ， 使 一 个 变量 不 会 和 两 个 不 同 的 表达 式 合 一 。 5 
PREI tns. 18 中 的 两 个 表达 式 可 以 用 图 6-33 中 的 两 个 初始 图 表示 , 图 中 的 每 个 结 点 所 
在 的 等 价 类 仅仅 包含 该 结 点 。 当 应 用 算法 6. 19 来 计算 unify, 9) 时 , 注意 到 结 点 1 和 9 表示 同 
一 个 运算 符 。 因 此 将 结 点 1 和 9 合并 成 同一 个 等 价 类 ,并 调用 unify(2, 10) 和 mm 沪 (8, 14)。 执 





行 wuify(1, 9) 得 到 的 结果 就 是 前 面 在 图 6-31 中 显示 的 图 。 口 
a 一 :9 
N Pi N 
2 hist: 8 x: 10 as cfd 


myd agi db. agi 7 oy 2 12 
图 6-33 ”初始 图 ,其 中 的 每 个 结 点 在 只 包含 该 结 点 自身 的 等 价 类 中 

如 果 算 法 6. 19 返回 tme, 我 们 可 以 按照 如 下 方法 构造 出 一 个 置换 $ 作为 合 一 替换 。 对 于 每 
个 变量 a, find(a) 给 出 a 的 等 价 类 的 代表 结 点 no n 所 表示 的 表达 式 为 S(a)。 例 如 , 在 图 6-31 中 ， 
我 们 看 到 as 的 代表 结 点 为 4, 这 个 结 点 表示 al 。 结 点 8 是 as 的 代表 结 点 , 这 个 结 点 表示 list( a ) 。 
置换 $ 的 结果 如 例 6. 18 所 示 。 
6.5.6 6.5 节 的 练习 

练习 6. 5. 1: 假定 图 6-26 中 的 函数 widen 可 以 处 理 图 6-25a 的 层次 结构 中 的 所 有 类 型 ， 翻 译 
下 列表 达 式 。 假 定 c Md 是 字符 型 , * 和 上 是 短 整 型 ,上 和) 为 整 型 , * 是 浮 点 型 。 

1) x=este 


2)izste 








3)x=(s +c) * (t+ a) 

练习 6. 5. 2: 像 Ada 中 那样 , 我 们 假设 每 个 表达 式 必须 具有 唯一 的 类 型 , 但 是 我 们 根据 一 个 
子 表达 式 本 身 只 能 推导 出 一 个 可 能 类 型 的 集合 。 也 就 是 说 , 将 函数 i 应 用 于 参数 E 其 文法 产 
ERN E 一 B1(Es)) 有 如 下 规则 : 

E. type = |t | Xf En. type PIES s, se FE E. type 中 |} 

描述 一 个 可 以 确定 每 个 子 表 达 式 的 唯一 类 型 的 语法 制导 定义 (SDD)。 它 首先 使 用 属性 type, 按照 
自 底 向 上 的 方式 综合 得 到 一 个 可 能 类 型 的 集合 。 在 确定 了 整个 表达 式 的 唯一 类 型 之 后 ， 自 顶 向 
下 地 确定 属性 unique 的 值 , 这 个 属性 表示 各 个 子 表达 式 的 类 型 。 


6.6 控制 流 


if-else 语句 、while 语句 这 类 语句 的 翻译 和 对 布尔 表达 式 的 翻译 是 结合 在 一 起 的 。 在 程序 设 
计 语 言 中 , 布尔 表达 式 经 常用 来 : 

1) 改变 控制 流 。 布 尔 表达 式 被 用 作 语句 中 改变 控制 流 的 条 件 表达 式 。 这 些 布尔 表达 式 的 什 
由 程序 到 达 的 某 个 位 置 隐 含 地 指出 。 例 如 , AEE) 5S 中 ,如 果 运 行 到 语句 5, 就 意味 着 表达 式 五 
的 取 值 为 真 。 

2) 计算 逻辑 值 。 一 个 布尔 表达 式 的 值 可 以 表示 true 或 false。 这 样 的 布尔 表达 式 也 可 以 像 算 
术 表 达 式 一 样 , 使 用 带 有 好 辑 运算 符 的 三 地 址 指令 进行 求 值 。 

布尔 表达 式 的 使 用 意图 要 根据 其 语法 上 下 文 来 确定 。 例 如 , 跟 在 关键 字 证 后 面 的 布尔 表达 
式 用 来 改变 控制 流 , 而 一 个 赋值 语句 右 部 的 表达 式 用 来 表示 一 个 逻辑 值 。 有 多 种 方式 可 以 描述 











中 间 代 码 生 成 257 





这 样 的 上 下 文 : 我 们 可 以 使 用 两 个 不 同 的 非 终 结 符号 也 可 以 使 用 继承 属性 , 还 可 以 在 语法 分 析 
过 程 中 设置 一 个 标记 。 此 外 , 我 们 还 可 以 建立 一 棵 语法 分 析 树 并 调用 不 同 的 过 程 来 处 理 布 尔 表 
达 式 的 两 种 不 同 的 使 用 。 

本 节 将 介绍 用 于 改变 控制 流 的 布尔 类 达 式 。 更 清楚 地 说 , 我 们 为 此 引入 一 个 新 的 非 终 结 符 
号 B。 存 6.6.6 节 中 ,我们 将 考虑 编译 器 如 何 使 得 布尔 表达 式 表示 好 辑 值 。 
6.6.1 布尔 表达 式 

布尔 表达 式 是 将 由 作用 于 布尔 变量 或 关系 表达 式 的 布尔 运算 符 而 构成 的 。 我 们 使 用 C 语言 
的 方法 , 用 &&、| 、! 分 别 表 示 AND, 、OR 、NOT 运算 符 。 关 系 表达 式 的 形式 为 E rel LE, HP, 
E 和 Es 为 算术 表达 式 。 在 本 节 中 , 我 们 考虑 的 是 由 如 下 文法 生成 的 布尔 表达 式 

-BoB | BIB&&B1IS Bl (B) Erel 天 ltrue false 

我 们 通过 属性 rel. op 来 指明 rel 究竟 表示 6 种 比较 运算 符 <、<=、=、1=、> 和 >= 中 的 哪 
一 种 。 按 照 惯 例 , 假设 | 和 && 是 左 结合 的 ，| 的 优先 级 最 低 , 其 次 为 &&, 再 其 次 为 !。 

给 定 表达 式 B || 8: ， 如 果 我 们 已 经 确定 B 为 真 , 那么 不 用 再 计算 B, 就 可 以 断定 整个 表达 
RAH. FN, E B RRB, WR BI 为 假 , 则 整个 表达 式 为 假 。 

程序 设计 语言 的 语义 定义 决定 了 是 否 需要 对 一 个 布尔 表达 式 的 各 个 部 分 都 进行 求 值 。 如 果 
语言 的 定义 允许 (或 要 求 ) 不 对 布尔 表达 式 的 某 个 部 分 求 值 ， 那么 编译 器 就 可 以 优化 布尔 表达 式 
的 求 值 过 程 ,只 要 已 经 求 值 的 部 分 足以 确定 整个 表达 式 值 就 可 以 了 。 因 此 , 在 表达 式 Bj || 8 中 ， 
By 和 By 都 不 一 定 要 完全 地 求 值 。 如 果 B 或 B, 是 具有 副作用 的 表达 式 ( 比如 它 包 含 了 改变 一 个 
全 局 变量 的 函数 ), 那么 这 么 做 就 可 能 会 得 到 意料 之 外 的 结果 。 
6.6.2 短路 代码 

在 短路 ( 跳 转 ) 代 码 中 , 布尔 运算 符 &&、 上 上 A! 被 翻译 成 跳 转 指令 。 运 算 符 本 身 不 出 现在 代 
BE, 布尔 表达 式 的 值 是 通过 代码 序列 中 的 位 置 来 表示 的 。 














语句 
if x < 100 goto Ly 
if (x<100 || x>200 && x! =y) x =0; ifFalse x > 200 goto Lı 
可 以 被 翻译 成 图 6-34 所 示 的 代码 。 在 这 个 翻译 中 , 如果 程 序 的 控 | ，， cae 从 人 Eve ki 
， 制 流 到 达 Ls, 就 表示 这 个 布尔 表达 式 为 真 。 如 果 表 达 式 为 假 , 则 |: 
程序 控制 流 将 跳 过 L> 和 赋值 语句 x =0, 直接 转 到 Li 。 o 
6.6.3 ”控制 流 语句 图 6-34 BRE ARES 


现在 我 们 考虑 在 按 下 列 文法 生成 的 语句 的 上 下 文中 , 如 何 
把 布尔 表达 式 翻 译 成 为 三 地 址 代码 。 
S— if (B) S, 
S— if (B) S, else S, 
S— while (B) S, 
在 这 些 产 生 式 中 , 非 终结 符号 B 表示 一 个 布尔 表达 式 , 非 终结 符号 S 表示 一 个 语句 。 

这 个 文法 将 例 5. 19 中 介绍 的 关于 while 表达 式 的 连续 使 用 的 例子 进行 了 推广 。 和 那个 例子 
一 样 , 8B 和 5 有 综合 属性 code, 该 局 性 给 出 了 翻译 得 到 的 三 地 址 指令 。 为 简单 起 见 , 我 们 使 用 语 
法 制导 定义 来 构造 得 到 翻译 结果 B. code 和 S. code, 结果 值 是 字符 串 。 定 义 了 code 属性 的 语义 规 
” 则 还 可 以 按照 下 面 的 方法 实现 : 首先 构造 语法 树 , 并 在 遍历 树 的 过 程 中 产生 目标 代码 。 这 些 规则 

还 可 以 通过 5.5 节 中 列 出 的 任何 方法 来 实现 。 

如 图 6-35a 所 示 , 对 站 (8) S, 的 翻译 结果 中 包含 了 B. code, 其 后 是 S51. code, B. code 中 存在 基 

于 8B 值 的 跳 转 。 如 果 B 为 真 , 控制 流转 向 $1. code 的 第 一 条 指令 ; 如 果 BAI, 控制 流 立 即 转向 
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紧 跟 在 S,. code 之 后 的 指令 。 











aaa to B.true ema pees to. B.true 
B.code _jto B. false B.code |to B false 
Barue:| 7 Birue :| | pr 
S;.code S, .code 
| 1 
B.false : goto S.nert 
B.false : | 
a) if f S>. code 
jigna) T — to B.true 人 
egin Gaa Snert : tee | 
| B.code to B.false ia | 
a a ee I : 
Bitrue : 5 1 b) if-else 
Si.code 
| goto begin | 
B.false :| te | 





c) while 
图 6-35 if, if-else, while 语句 的 代码 


B. code: 和 S. code 中 的 跳 转 标号 使 用 继承 属性 来 处 理 。 我 们 将 布尔 表达 式 B 和 两 个 标号 : 
B. true 和 B. false 相关 联 。 当 B 为 真 时 控制 流转 到 B. trues 4 B 为 假 时 控制 流转 到 B. false。 我 们 
将 语句 S 和 继承 属性 S. next 相关 联 , 这 个 属性 表示 紧 跟 在 S 代码 之 后 的 指令 的 标号 。 在 某 些 情况 
F, ARÉ S. code 之 后 的 指令 是 一 个 跳 转 到 某 个 标号 了 的 跳 转 指令 。 使 用 5. next 可 以 避免 在 
S. code 中 出 现 这 样 的 一 个 跳 转 指 令 , 它 的 目标 又 是 一 个 以 上 为 目标 的 跳 转 指令 。 

图 6-36 和 图 6-37 给 出 的 语法 制导 定义 可 以 为 在 过、if-else 及 while 语句 的 上 下 文中 的 布尔 表 
达 式 生成 三 地 址 代码 。 











产生 式 语义 规则 | 
P> S S.nezt = newlabel() 











P.code = S.code || label(S.next) 
9 一 assign S.code = assign.code 


9 一 if(B)S B.true = newlabel() 
B.false = Si.nert = Snert 
S.code = B.code || label(B.true) || S1.code 


S > if (B) S, else S3 | B.true = newlabel() 
B.false = newlabel() 
S,.nett = So.next = Snert 
S.code = B.code 
|| debel(B. true) || S1.code 
|| gen(‘goto’ S.nezt) 
|| label(B false) || S.code 


9 一 while (B) S, begin = newlabel() 
B.true = newlabel() 
B false = S.next 
Sinnest = begin 
S.code = label(begin) || B.code 
|| label(B.true) || S1.code 
|| gen(‘goto! begin) 





9 > Sı 92 S;.next = newlabel() 
So.next = S.next 
| S.code = Sj.code || label S, 


图 6-36 控制 流 语句 的 语法 制导 定义 


neat) || $2.code 
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我 们 假定 每 次 调用 newlabel( ) 都 会 产生 一 个 新 的 标号 , 并 假设 label (L) 将 标号 大 附加 到 即将 
生成 的 下 一 条 三 地 址 指令 上 号 。 

一 个 程序 包含 一 条 由 产生 式 P 一 $ 生成 的 语句 。 和 这 个 产生 式 关 联 的 语义 规则 将 5. next 初始 
化 为 一 个 新 标号 。P. code 包含 S. code, S. code 之 后 是 新 标号 S. next, PH AE Tk S—assign 中 的 词法 
单元 assign 是 一 个 表示 赋值 语句 的 占 位 符 。 赋 值 语句 的 翻译 和 6.4 节 中 讨论 的 方法 相同 。 在 这 
里 对 控制 流 的 讨论 中 ,5S. code 就 是 assign. code, 

在 翻译 5S- 站 (B).S, 时 , 图 6-36 中 的 语义 规则 创建 一 个 新 的 标号 B. true, 并 将 其 关联 到 为 语 
向 Si 生成 的 第 一 条 三 地 址 指令 中 ,如 图 6-35a 所 示 。 因 此 , B 的 代码 中 跳 转 到 B. true 的 指令 将 跳 
转 到 语句 Si 对 应 的 代码 处 。 不 仅 如 此 , 通过 将 B. false 设 为 5. net, 我 们 保证 了 当 B 的 值 为 假 时 ， 
控制 流 将 跳 过 51 的 代码 。 

在 翻译 if-else 语句 S—if (B) Sı else S, If, 布尔 表达 式 B8 的 代码 中 有 一 些 向 外 跳 转 的 指令 
它们 在 B 为 真 时 跳 转 到 51 的 代码 的 第 一 条 指令 ; E B 为 假 时 跳 转 到 S 的 代码 的 第 一 条 指令 , 如 
图 6-35b 所 示 。 然 后 , 控制 流 从 S| 或 5， 转 到 紧 跟 在 $ 的 代码 之 后 的 三 地 址 指令 一 一 该 指令 的 标 
号 由 继承 属性 S. new 指定 。 在 S 的 代码 之 后 有 一 条 goto S. next 指令 , 使 得 控制 流 越过 S 的 代 
Bo Sy 的 代码 之 后 不 需要 goto 语句 ， 因 为 9. next HE S. next 

如 图 6-35c 所 了 示 , S—while(B)S, B. code 和 S. code 组 成 。 我 们 使 用 一 个 局 部 变量 
begin 来 存放 附加 在 这 个 while 语句 的 第 一 条 指令 上 的 标号 。 这 个 while 语句 的 第 一 条 指令 也 是 B 
的 第 一 条 指令 。 我 们 在 这 里 使 用 变量 而 不 是 属性 ， 是 因为 begin 对 于 这 个 产生 式 的 语义 规则 而 言 
是 局 部 的 。 继 承 属性 S. next 标记 了 当 8 为 假 时 控制 流 必须 转向 的 标号 。 因 此 ，B. false 被 设置 为 
S. next. FES, 的 第 一 条 指令 上 附加 了 一 个 新 标号 B. true。8 的 指令 中 的 跳 转 指令 在 为 真 时 跳 转 到 
这 个 标号 。 我 们 在 S 的 代码 之 后 放置 了 一 条 指令 goto begin, 它 跳 回 到 布尔 表达 式 的 代码 的 开始 
Aho WEE, Si next 被 设置 为 标号 begin, 因此 从 $i. code 中 跳出 的 指令 可 以 直接 跳 转 到 begino 

S—+S,S> eee Si 的 代码 , 然后 是 5; 的 代码 。 相 应 的 语义 规则 主要 处 理 标 号 。5) 的 
代码 之 后 的 第 一 条 指令 就 是 S 的 代码 的 起 始 指 令 。 紧 跟 在 S 的 代码 之 后 的 指令 也 是 跟 在 5 的 
代码 之 后 的 指令 。 

我 们 将 在 6.7 节 中 进一步 讨论 控制 流 语 句 的 翻译 。 在 那里 我 们 将 使 用 另 一 种 被 称 为 回填 的 
方法 , 它 可 以 在 一 次 扫描 中 生成 各 个 语句 的 代码 。 

6.6.4 布尔 表达 式 的 控制 流 翻译 

图 6-37 中 针对 布尔 表达 式 的 语义 规则 是 图 6-36 中 语句 的 语义 规则 的 一 个 补充 。 如 图 6-35 中 
的 代码 布局 方案 所 示 , 一 个 布尔 表达 式 8 被 翻译 为 一 个 三 地 址 指令 , 它 将 使 用 条 件 或 无 条 件 跳 转 
指令 来 对 8 求 值 。 这 些 跳 转 指令 的 目标 是 两 个 标号 之 一 : 当 B 为 真 时 是 B. true, 4 B 为 假 时 是 
B. false , 

图 6-37 中 的 第 四 个 产生 式 , BI BOL, re 5 ,直接 被 翻译 成 三 地 址 比较 指令 ， 跳 转 到 正确 的 
位 置 。 例 如 , a <b 被 翻译 成 : 


if a < b goto B.true 
goto B.false 














。 如 果 严格 地 按照 上 面 的 语义 规则 来 实现 ,这 些 语义 规则 将 产生 很 多 标号 ,并 可 能 在 一 个 三 地 址 指令 上 附加 多 个 标 
号 。6.7 节 中 介绍 的 回填 技术 只 在 必要 的 时 候 创建 标号。 处 理 这 个 问题 的 另 一 各 方法 是 在 后 续 的 优化 步骤 中 消除 
不 必要 的 标号 。 
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语义 规则 








| B 3 B, i| B 


B B, && D 

B ! Bı 

B El rel E 
true 

B false 





B,.true = B.true 

B,.false = newlabel() 

By.true = B.true 

Bo. false = B.false 

B.code = By,.code || label(B,.false) || Bz.code 


By.true = newlabel() 

B,.false = B. false 

Bo.true = B.true’ 

By. false = B.false 

B.code = By.code || label(B,.true) || B2.code 


- By.true = B. false 
Bi.false = B.true 
B.code = B,.code 
B.code = E,.code || Ez.code 
|| gen('it! E,.addr rel.op E2.addr ‘goto’ B.true) 
|| gen(‘goto’ B. false) 
B.code = gen('goto' B.true) 


| B.code = gen('goto’ B. false) 





E 6-37 ”为 布尔 表达 式 生 成 三 地 址 代码 

B 的 其 余 产生 式 按 照 下 面 的 方法 翻译 : 

1) 假定 8 形 如 Bi lB,。 如 果 Bi AR, 那么 我 们 立刻 知道 8 本 身 也 为 真 , 因此 By. true 和 

B. true 相同 。 如 果 By 为 假 , 那么 就 必须 对 B, RE, 因此 我 们 将 B. false 设置 为 By 的 代码 的 第 一 


条 指令 的 标号 。B。 的 真 假 出 口 分 别 等 于 
2) Bi&&B| 的 翻译 方法 类 似 于 1。 
3) 不 需要 为 BoB, 产生 新 的 代码 
BK, 
4) 将 常量 true 和 false 分 别 翻译 成 
B. false 的 跳 转 指 令 。 


B 的 真 假 出 日 。 





重新 考虑 例 6. 21 中 的 下 列 语句 ， 


if (x<100 || x>200 &&x!=y ) 


使 用 图 6-36 和 图 6-37 中 的 语法 制导 定义 , 我 们 可 以 得 到 


图 6-38 中 的 代码 。 


语句 (6. 13) 是 图 6-36 中 的 产生 式 Ps 生成 的 一 个 
程序 。 这 个 产生 式 的 语义 规则 生成 了 S 的 代码 之 后 的 第 
一 条 指令 的 新 标号 Li。 语 句 的 形式 为 证 B) S, 其 中 | 
S, 是 x=0。 因 此 , 图 6-36 中 的 规则 生成 了 一 个 新 标号 La, 并 将 它 附加 到 S. code 的 第 一 条 (在 这 … 


个 例子 中 也 是 唯一 的 ) 指 令 , Bx =0 处 。 


因为 ‖ 的 优先 级 低 于 &&, 所 以 式 (6.13 ) 中 的 布尔 表达 式 的 形式 为 B, | BL, 其 中 B 是 
x <100。 按 照 图 6-37 中 的 规则 ， By. true 是 La, BHEE x =0 的 标号 ; B1. fabe 是 一 个 新 的 标号 L» 


它 附 加 在 B, 的 代码 的 第 一 条 指令 上 。 


值得 注意 的 是 , 生成 的 代码 不 是 最 优 的 , 因为 这 个 翻译 结果 比例 6.21 中 的 代码 多 三 条 ( goto) 
指令 。 指 令 goto L, 是 元 余 的 , AX L 恰巧 就 是 下 一 条 指令 的 标号 。 如 果 像 例 6.21 中 那样 使 用 


， 只 需要 将 8 中 的 真 假 出 口 对 换 , 就 可 分 别 得 到 8 的 真 














目标 为 B. true 和 if x < 100 goto Lz 
goto L3 
L3: if x > 200 goto Li 
goto Lı 
x=0; (6. 13) Ly: if x '= y goto Ly 
goto Li 
Le: x= 0 
Li: 
图 6-38 一 个 简单 的 RY 


控制 流 翻译 结果 
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ifFalse 指令 , 而 不 使 用 if 指令 , 那么 两 条 goto L, 指令 也 可 以 被 消除 。 
6.6.5 避免 生成 元 余 的 goto 指令 
在 例 6. 22 中 ,比较 表达 式 x > 200 被 翻译 成 如 下 代码 片段 : 


if x > 200 goto Ly 
goto ly 

















Ly: 


可 以 将 上 面 的 指令 替换 为 如 下 指令 : 
ifFalse x > 200 goto L; 
Lys pt 


ifFlase 指令 利用 了 控制 流 在 指令 序列 中 会 从 一 个 指令 目 然 流动 到 下 一 个 指令 的 性 质 ， 央 
此 当 x* > 200 时 , 控制 流 直接 “穿越 ”到 标号 L4 ， 从 而 减少 T 一 个 跳 转 指令 。 

在 图 6-35 中 所 示 的 if Ml while 语句 的 代码 布局 中 ,Si 的 代码 紧 跟 在 布尔 表达 式 B 的 代码 之 
后 。 通 过 使 用 一 个 特殊 标号 “fal”( 即 “不 要 生成 任何 跳 转 指 令 ”"), 我们 可 以 修改 图 6-36 和 
图 6-37 中 的 语义 规则 ,支持 控制 流 从 8 的 代码 直接 穿越 到 S, 的 代码 。 图 6-36 中 的 产生 式 


S-sif(B)S,; 的 新 语义 规则 将 B. true WH fall: 
B.truc = fall 
B false = Sinext = S.next 
S.code = B.code |} Sy.code 


类 似 地 , if-else 和 while 语 包 的 规则 也 将 B. true HH fall, 

现在 我 们 将 修改 布尔 表达 式 的 语义 规则 , 使 之 尽 可 能 地 允许 控制 流 穿越 。 在 B. true 和 
B. false 都 是 显 式 的 标号 时 , 也 就 是 说 它们 都 不 等 于 fall 时 , 图 6-39 中 的 BE, rel E, 的 新 规则 将 
产生 两 条 指令 (和 图 6-37 一 样 ) 。 和 否则 , WR B. true 是 显 式 的 标号 , 那么 B. false 一 定 是 fall, 因此 
它们 产生 一 条 if 指令 , 使 得 当 条 件 为 假 时 控制 流 穿越 到 下 一 条 指令 。 反 过 来 ， 如果 B. false 是 显 
式 的 标号 , 那么 它 z 们 产生 一 条 ifFalse 指令 。 在 其 余 情况 中 ,B. true FI B. false 都 是 fall, 因此 不 
产生 任何 跳 转 指令 昌 。 


test = £,.addr rel.op Es.addr 
s = if B.true £ fall and B false # fall then 
gen('it' test ‘goto’ B.true) || gen(‘goto' B. false) 
else if B.true £ fall then gen(‘if! test ‘goto’ B.truc) 
else if B false + fall then gen('ifFalse’ test ‘goto’ B. false) 
else '’ 


B.code = F\.code || E.code || $ 














图 6-39 BoE, rel £E, 的 语义 规则 


在 图 6-40 中 显示 的 BB, || By 的 新 规 l 
则 中 ,请 注意 8 的 fall HEA B, 的 fall 标号 a # fallthen B.true else newlabel() 
具有 不 同 的 含义 。 假 定 B. true H fall, 即 如 果 | By true = B.truc 


B 为 真 时 控制 流 穿越 B。 Be ie arn By.false = B.false 
为 真 时 控制 流 穿越 虽然 当 Bi AAN B B.code = if B.true £ fall then B,.code || B».code 








的 值 必然 为 真 , 但 B,. true 必须 保证 控制 流 跳 else Bi.code || By.code || label( By true) 
过 B, 的 代码 , BREAK B 之 后 的 下 一 条 





指令 。 图 6-40 BB, || B, 的 语义 规则 


另 一 方面 , WRB, HEAR, B 的 真 假 值 就 由 Bs WERE. KIE, E 6-40 中 的 规则 保证 





© ECA Jaah, 表达 式 中 可 能 包含 赋值 语句 , 因此 即使 B. true ANB. false HSH fall, 也 必须 为 子 表达 式 E, ME, E 
成 代码 。 如 果 必 要 , 无 用 代码 可 以 在 优化 阶段 被 清除 。 
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By. false 对 应 于 控制 流 穿越 B, 直接 到 达 Bs 的 代码 的 情况 。 
BB, RRB, 的 语义 规则 和 图 640 中 的 语义 规则 类 似 , 我 们 将 其 留 作 练习 。 

















使 用 了 特殊 标号 Jali 的 语义 规则 将 例 6.21 中 Gee Kihei 

的 程序 (6. 13) ifFalse x > 200 goto Li 

， ifFalse x != y goto Li 

if (x<100 || x>200 && x!=y ) x=0; Ba. wi 

翻译 成 图 641 所 示 的 代码 。 oe 

和 例 6.22 一 样 ， 产生 式 PS 的 语义 规则 创建 标号 
Lio All 6. 22 不 同 的 是 , 当 应 用 BB, || By 的 语义 规则 图 6-41 使 用 控制 流 穿越 
AY, 继承 属性 B. true 是 fall (B. false 为 L)。 图 640 中 的 技术 翻译 的 让 语句 


规则 创建 一 个 新 标号 Ly, 使 得 当 B 为 真 时 有 一 个 跳 转 指令 可 以 跳 过 By 的 代码 。 因 此 ,Bi. true 
dy Ly 而 By. false J fall, 因为 Bj 为 假 时 必须 计算 Ba 的 值 。 

当 开 始 处 理 生成 了 表达 式 x <100 的 产生 式 BE, rel E, 时 ，B. true =L, E B. false = fall, 
6-39 中 的 规则 使 用 这 些 继承 到 的 标号 生成 了 一 条 指令 if x <100 goto La 。 
6.6.6 布尔 值 和 跳 转 代 码 

本 节 讨 论 的 重点 是 用 于 改变 语句 中 控制 流 的 布尔 表达 式 。 一 个 布尔 表达 式 的 目的 可 能 就 是 
要 求 出 它 的 值 , W x=true; 或 x =a<b; 的 语句 中 的 布尔 表达 式 就 是 这 样 。 


| 














处 理 布尔 表达 式 的 这 两 种 角色 的 一 种 简单 思路 是 首先 建立 表达 式 的 抽象 语法 树 ,可 以 使 用 下 
面 的 两 种 方法 之 一 : 


1) 使 用 两 趟 处 理 的 方法 。 为 输入 构造 出 完整 的 抽象 语法 树 ， 然 后 以 深度 优先 顺序 遍历 这 要 
抽象 语法 树 , 依据 语义 规则 的 描述 计算 得 到 翻译 结果 。 
2) 对 语句 进行 一 趟 处 理 , 但 对 表达 式 进 行 两 赵 处 理 。 使 用 这 种 方法 时 , 我 们 将 首先 翻译 语 
向 while(E) S, PRE, 然后 再 处 理 S,, SAM, BM ERT, 需要 首先 建立 它 的 抽象 语法 树 ， 
然后 再 遍历 它 。 
在 下 列 文法 中 ,用 单个 非 终 结 符号 E 来 代表 表达 式 : 
Sid =E; | if (E) S | while (E)SISS 
E>E |E | ER&E\ErelE| E+E | (E) | id | true | false ; 
非 终 结 符号 巨 支配 了 Swhile (£) Si 的 控制 流 。 同 一 个 非 终 结 符号 正在 Sid =E AIEEE + . 
E 中 则 表示 一 个 值 。 3 
我 们 可 以 使 用 不 同 的 代码 生成 函数 处 理 表 达 式 的 这 两 种 角色 。 假 定 属性 E. n 表示 对 应 于 表达 
式 五 的 抽象 语法 树 结 点 , 并 且 抽 象 语法 树 中 的 结 点 都 是 对 象 。 令 方法 jump 产生 一 个 表达 式 结 点 的 
跳 转 代 码 , 并 令 方 法 rvelue 产生 计算 结 点 的 值 的 代码 , 该 代码 还 把 得 到 的 值 存储 在 一 个 临时 变量 中 。 
对 于 出 现在 Swhile (E) S, PRE, TAA E n LARDI jump。 方 法 jump 的 实现 是 基于 
图 6-37 给 出 的 关于 布尔 表达 式 的 语义 规则 。 确 切 地 说 , 跳 转 代码 是 通过 调用 E.n. jump, f) ER 
的 , 其 中 1 是 指向 51. code 的 第 一 条 指令 的 新 标号 , 而 /就 














是 标号 S. next, ifFalse a < b goto L; 
对 于 出 现在 Soid =F; PHE, TES E.n LAAN ifFalse c < d goto Li 

法 realue, W3 E JEW E, + ,方法 调用 E. n. rvalue( ) 按 a 

照 6.4 节 中 讨论 的 方法 生成 代码 。 如 果 EEUE RRE, Li: t = false 

我 们 首先 为 E 生成 跳 转 代码 , 然后 在 跳 转 代码 的 真 假 出 口 人 





es a 图 6- 42 通过 计算 一 个 临时 变量 的 
例如 ， 赋值 语句 x=a<b&g&gc<a 可 以 用 图 642 中 的 值 来 翻译 一 个 布尔 类 型 的 赋值 语句 
代码 来 实现 。 | 





”中间 代码 生成 
一 一 一 = 2 
“6.6.7 6.6 节 的 练习 
ou 练习 6.6.1: 在 图 6-36 的 语法 制导 定义 中 添加 处 理 下 
列 控制 流 构造 的 规则 : 
E 1) 一 个 repeat 语句 , repeat S while B, 

12) 一 个 for 循环 语句 , for (S1; B; Sy) S30 
; 练习 6. 6.2: 现代 计算 机 试图 在 同一 时 刻 执行 多 条 指令 ,其 中 包括 各 种 分 支 指令 。 因 此 ， 当 
计算 机 投机 性 地 预先 执行 某 个 分 支 , 但 实际 控制 流 却 进入 另 一 分 支 时 (此 时 所 有 预先 执行 的 投机 
工作 将 被 扫 弃 ) ,付出 的 代价 是 很 大 的 。 因 此 我 们 希望 尽 可 能 地 减少 分 支 数 量 。 请 注意 ,在 
. 图 6-35e 中 while 循环 语句 的 实现 中 ,每 个 迭代 有 两 个 分 支 : 一 个 是 从 条 件 妃 进入 到 循环 体 中 , 另 
一 个 分 支 跳 转 回 B 的 代码 。 基 于 尽量 减少 分 支 的 考虑 , 我 们 通常 更 倾向 于 将 while(8) S 当 作 
if (B) |repeat Suntil ! (她 )} 来 实现 。 给 出 这 种 翻译 方法 的 代码 布局 , 并 修改 图 6-36 中 while 循 
环 语句 的 规则 。 

| 练习 6. 6.3: 假设 C 中 存在 一 个 异 或 运算 ( 当 且 仅 当 两 个 分 量 恰 有 一 个 为 真 时 , 表达 式 为 
真 )。 按 照 图 6-37 的 风格 写 出 这 个 运算 符 的 代码 生成 规则 。 
练习 6. 6.4: 使 用 6. 6. 5 节 中 介绍 的 避免 goto 语句 的 翻译 方案 , 翻译 下 列表 达 式 : 


1) if (a==b && c==d || e==f) x == 1; 








2) if (a==b |] c==d || e==f) x == 1; 

3) if (a==b && c==d && e==f) x == 1; 

练习 6.6.5; 基于 图 6-36 和 图 6-37 中 给 出 的 语法 制导 定义 ,给 出 一 个 翻译 方案 。 

练习 6.6.6; 使 用 类 似 于 图 6-39 和 图 640 中 的 规则 , 修改 图 6-36 和 图 6-37 的 语义 规则 , 使 
之 允许 控制 流 穿越 。 

| 练习 6. 6.7; 练习 6. 6.6 中 的 语句 的 语义 规则 产生 了 一 些 不 必要 的 标号 。 修 改 图 6-36 中 语 
句 的 规则 ,使 之 只 创建 必要 的 标号 。 你 可 以 使 用 特殊 标号 deferred 来 表示 还 没有 创建 一 个 标号 。 
你 的 语义 规则 必须 能 够 生成 类 似 于 例 6. 21 的 代码 。 

1) 练习 6. 6. 8: 6.6.5 节 中 讨论 了 如 何 使 用 穿越 代码 来 尽 可 能 减少 生成 的 中 间 代 码 中 跳 转 
指令 的 数目 。 然 而 , 它 并 没有 充分 考虑 将 一 个 条 件 赫 换 为 它 的 补 的 方法 ,例如 将 iEa < b goto 
Ly; goto Ly; 替换 为 if a >=b goto Ls; goto Li。 给 出 一 个 语法 制导 定义 , 它 在 需要 时 可 以 
利用 这 种 蔡 换 方法 。 


6.7 回填 


为 布尔 表达 式 和 控制 流 语句 生成 目标 代码 时 ,关键 问题 之 一 是 将 一 个 跳 转 指令 和 该 指令 的 
目标 匹配 起 来 。 例 如 , Mit (B) 5 中 的 布尔 表达 式 中 的 翻译 结果 中 包含 一 条 跳 转 指令 。 当 B 为 
假 时 , 该 指令 将 跳 转 到 紧 跟 在 5 的 代码 之 后 的 指令 处 。 在 一 趟 式 的 翻译 中 ,8 必须 在 处 理 5 之 前 
就 翻译 完毕 。 那 么 跳 过 $ 的 goto 指令 的 目标 是 什么 呢 ? 在 6.6 节 中 , 我 们 解决 这 个 问题 的 方法 
是 将 标号 作为 继承 属性 传递 到 生成 相关 跳 转 指令 的 地 方 。 但 是 , 这 样 的 做 法 要 求 再 进行 一 趟 处 
H, 将 标号 和 具体 地 址 绑 定 起 来 。 

本 节 将 介绍 一 种 被 称 为 回填 (backpatching) 的 补充 性 技术 , 它 把 一 个 由 跳 转 指令 组 成 的 列表 
以 综合 属性 的 形式 进行 传递 。 明 确 地 讲 , 生成 一 个 跳 转 指令 时 暂时 不 指定 该 跳 转 指 令 的 目标 。 
这 样 的 指令 都 被 放 人 一 个 由 跳 转 指令 组 成 的 列表 中 。 等 到 能 够 确定 正确 的 目标 标号 时 才 去 填充 
这 些 指令 的 目标 标号 。 同 一 个 列表 中 的 所 有 跳 转 指令 具有 相同 的 目标 标号 。 

6.7.1 使 用 回填 技术 的 一 趟 式 目标 代码 生成 
回填 技术 可 以 用 来 在 一 趟 扫描 中 完成 对 布尔 表达 式 或 控制 流 语 句 的 目标 代码 生成 。 我 们 生 
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成 的 目标 代码 的 形式 和 6.6 节 中 的 代码 的 形式 相同 , 但 是 处 理 标号 的 方法 不 同 。 

在 本 节 中 , 非 终结 符号 B 的 综合 属性 truelist 和 falselist 将 用 来 管理 布尔 表达 式 的 跳 转 代码 中 
的 标号 。 特 别 的 ，B. truelist 将 是 一 个 包含 跳 转 或 条 件 跳 转 指令 的 列表 , 我 们 必须 向 这 些 指令 中 捅 
入 适当 的 标号 , 也 就 是 当 B 为 真 时 控制 流 应 该 转向 的 标号 。 类 似 地 ,，B. falselist 也 是 一 个 包含 跳 
转 指 令 的 列表 ,这 些 指令 最 终 获 得 的 标号 就 是 当 B 为 假 时 控制 流 应 该 转向 的 标号 。 在 生成 B 的 
代码 时 ， 跳 转 到 真 或 假 出 口 的 跳 转 指令 是 不 完整 的 , 标号 字段 尚未 填写 。 这 些 不 完整 的 跳 转 指令 
被 保存 在 B. truelist 和 B. falselist 所 指 的 列表 中 。 类 似 地 , 语句 5 的 综合 属性 S. nextlist 也 是 一 个 跳 
转 指 令 列表 , 这 些 指令 应 该 跳 转 到 紧 跟 在 $ 的 代码 之 后 的 指令 。 

更 明确 地 讲 , 我 们 将 生成 的 指令 放 入 一 个 指令 数组 中 , 而 标号 就 是 这 个 数组 的 下 标 。 为 了 处 
理 跳 转 指令 的 列表 , 我 们 使 用 下 面 三 个 函数 : 

1) makelist(i) 创 建 一 个 只 包含 i 的 列表 。 这 里 i 是 指令 数组 的 下 标 。 耳 数 makelist 返回 一 个 
此 向 新 创建 的 列表 的 指针 。 

2) merge(pi, ps) 将 pi 和 ps 指向 的 列表 进行 合并 , 它 返回 的 指针 指向 合并 后 的 列表 。 

3) backpatch(p, i) 将 作为 目标 标号 插入 到 p 所 指 列表 中 的 各 指令 中 。 
6. 7.2 布尔 表达 式 的 回填 

现在 我 们 构造 一 个 可 以 在 自 底 向 上 语法 分 析 过 程 中 为 布尔 表达 式 生成 目标 代码 的 翻译 方案 。 
这 个 文法 中 有 一 个 标记 非 终 结 符号 外。 它 引 发 的 语义 动作 在 适当 的 时 刻 获 取 将 要 生成 的 下 一 条 
指令 的 下 标 。 该 文法 如 下 : 


Bo BNIMB |B && M By |! By, | (B,)| E rel Ey | true | false 
Mo 


翻译 方案 如 图 6-43 所 示 。 











D B>B I M Bs { backpatch(B, falselist. M instr): 
B truclist = merge By .truelist, By.truelist): 
B. falselist = By falsclist: } 
2) BoB, && M Ba { backpatch( By .truelist, M instr): 
Bitruelist = By.truclist: 
B falselist = merge( B, .falsclist, By.falselist); } 

3) Bo 1B { B.truelist = Bi.falselist: 

B.falselist = By .truelist: } 

4) Bo(B,) { B.truelist = B, .truelist; 

B falselist = By.falselist, } 

5) BoE rel Ey { B.truelist = makelist( neatinstr): 
B.falsclist = makelist(nentinstr + 1); 
gen(‘if! Ey .addr rel.op Ey.addr ‘goto _'): 
gen(‘goto _'): } 

6) B= true { B.truelist = makelist( nextinstr}; 
gen('goto 1): } 

7) B- false { B.falsclist = makelist( nertinstr); 
gen (‘goto '): } 

8) Ase { M instr = nextinstr, } 








图 6-43 布尔 表达 式 的 翻译 方案 
考虑 上 述 文法 中 对 应 于 规则 BB, || MB, 的 语义 动作 (1) WRB, WH, 那么 8 也 为 真 , 这 
FE Bi. truclist 中 的 跳 转 指令 就 成 为 B. truelist 的 一 部 分 。 然 而 , 如果 Bi 为 假 , 我 们 下 一 步 必须 测 
“ARB, (ADL By. falselist 中 的 跳 转 指令 的 目标 必定 是 B, 的 代码 的 起 始 位 置 。 这 个 位 置 使 用 标记 非 





中 间 代码 生成 a 





终结 符号 M 获得 。 在 即将 生成 B 代码 之 前 , 凡生 成 了 下 一 条 指令 的 序号 , 存放 在 综合 属性 
M. instr 中 。 

为 了 获得 指令 序号 , 我 们 将 产生 式 Me 和 语义 动作 

| M. instr =nextinstr; | 

关联 起 来 。 变量 nextinstr 保存 了 紧 跟 着 的 下 一 条 指令 的 序号 。 当 我 们 已 经 看 到 了 产生 式 
B>B, || M DB; 的 余下 部 分 时 , 这 个 值 将 被 回填 到 B. falselise 中 的 指令 上 ( 即 By. falselist 中 的 每 条 

令 都 把 M. instr 当 作 目 标 标 号 ) 。 

BB, && M B, 的 语义 动作 (2) 和 动作 (1) 类 似 。B 一 18 的 语义 动作 (3 ) MIRAI, By 
作 (4) 只 是 忽略 括号 。 

为 简单 起 见 , 语义 动作 (5 ) 生成 了 两 条 指令 : 一 个 条 件 转 移 指 令 goto 和 一 个 无 条 件 转移 指 
令 。 它 们 opera 号 都 未 填写 。 这 两 个 指令 被 放 人 新 的 分 别 由 B. truelist 和 B. falselist 指向 的 列 
表 中 。 
再 次 考虑 表达 式 | 

r < 100 Wa>20&& «i= y 


EMER FRET A A A 6-44 所 示 。 为 了 增加 可 读 性 , 属性 truelist , falselist 和 instr 分 别 用 
它们 的 第 一 ee HEIN PUB AR ETRE OL ea eT MOE. AA WE 
都 出 现在 规则 右 部 的 最 后 , 因此 它们 可 以 和 自 底 向 上 语法 分 析 T ARREN 时 进行 。 在 
根据 产生 式 (5) 将 x <100 BAH B 时 , 语义 动作 相应 地 产生 两 条 指 


100: aif x < 100 goto - 
101: goto - 


我 们 任意 地 从 100 开始 为 指令 编号 。 产 生 式 

B > BillM Bz 
中 的 标记 非 终结 符号 MER T nextinstr 的 值 ， 此 时 这 个 值 为 102。 使 用 产生 式 (5) 将 x>200 归 约 
为 8 产生 下 面 两 条 指令 


102: if x > 200 goto - 
103: goto - 


FREA x > 200 对 应 于 下 面 产 生 式 中 的 B: 


Bo B, && M Bz 


标记 非 终结 符号 MM 记录 了 nextinstr 的 当前 值 , 现在 是 104。 使 用 产生 式 (5) 将 x1 =y 归 约 为 B 产 





生 下 列 指令 
104: if x != y goto - 
105: goto - 


B.t = {100, 104} 
B.f = £103, 105} 


eae 


Bt = {100} | B= {104} 
B.f = {101} Z B.f = a 105} 
/ 1 rs Pe 
ae i 
ae && Ala = 104 oe 

Ba = {102} | B.t = {104} 
B.f = {103} ; B.f = {103} 
AVN ZIN 
x > 200 x l= y 


图 6- 44 «<100 || x>200 && x! =y 的 注释 语法 分 析 树 
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我 们 现在 使 用 BB &&M Ba 进行 妇 约 。 相 应 的 语义 动作 调用 backpatch( By. truelist, M. instr) 
将 B, WY AA Sh eB B, 的 第 一 条 指令 处 。 因 为 

















B,. truelist 是 11021, M. instr 是 104， 这 次 对 backpatch 的 调 100i: rf "< OSEoL9 ss 
用 将 序号 104 填写 到 102 指令 中 。 至 今 为 止 产生 的 六 条 | 102 Sre 3 200 goto 104 
A RA 6-45a 所 示 。 103: goto - 
vhs 了 = H- 104: if x != y goto - 
和 最 后 一 次 归 约 使 用 的 产生 式 BB || MB, 相关 联 | 105 Soko 
的 语义 动作 调用 backpatch( {101}, 102), 得 到 的 指令 如 L 
图 6-45b 所 示 。 a) 将 104 回填 到 指令 102 中 之 后 
整个 表达 式 为 真 当 且 仅 当 控制 流 到 达 100 和 104 位 100: if x < 100 goto - 
EL ORAS ; 表达 式 为 假 当 且 仅 当 控制 流 到 达 103 和 | ye > 200 goto 104 
105 位 置 上 的 跳 转 指令 。 在 后 续 的 编译 过 程 中 ， 当 已 知 表 103: goto - 
达 式 为 真 或 假 时 分 别 应 该 做 什么 的 时 候 , 这 些 指令 的 目 T 
标 将 会 被 填写 完整 。 ek it | 
6.7.3 控制 转移 语句 b) 将 102 回填 到 指令 101 中 之 后 
现在 我 们 使 用 回填 技术 在 一 趟 扫描 中 完成 控制 流 语 图 6-45 ”回填 的 步骤 


句 的 翻译 。 考 虑 由 下 列 文法 产生 的 语句 : 
S > if(B)S | if€(B)SelseS | while(B)S | {LI|A; 
LES NS 


这 里 5 表示 一 个 语句 ,了 是 一 个 语句 的 列表 , 4 是 一 个 赋值 语句 , B 是 一 个 布尔 表达 式 。 请 注意 ， 
一 定 还 存在 一 些 其 他 的 产生 式 ， 比 如 那些 关于 赋值 语句 的 产生 式 。 然 而 , 这 里 给 出 的 这 些 产生 式 
已 经 足以 用 来 说 明 在 控制 流 语句 的 翻译 中 用 到 的 技术 。 
FIAJ if, if-else 和 while 的 代码 布局 和 6. 6 节 中 的 描述 一 样 。 我 们 给 出 一 个 隐 含 的 假设 , 即 指 
令 数组 中 的 代码 顺序 反映 了 控制 流 的 自然 流动 , 即 控制 从 一 条 语句 到 达 下 一 条 语句 。 假 如 没有 
这 个 假设 , 那么 我 们 就 必须 明确 插入 跳 转 指令 来 实现 自然 的 顺序 控制 流 。 
图 6-46 中 的 翻译 方案 保留 了 多 个 跳 转 指令 的 列表 ， 当 确定 了 这 些 跳 转 指令 的 目标 序号 后 就 
会 回填 列表 。 如 图 643 所 示 , 由 非 终 结 符号 8 生成 的 布尔 表达 式 有 两 个 跳 转 指令 列表 : B. truelist 
和 B. falselist。 它 们 分 别 对 应 于 B 的 代码 的 真 假 出 口 。 由 非 终 结 符号 5 和 世 生 成 的 语句 也 有 一 个 
待 回填 的 跳 转 指 令 列 表 , 由 属性 nextlist 表示 。 列 表 S. nextlist 中 包含 了 所 有 跳 转 到 按照 运行 顺序 
RIRE S 代码 之 后 的 指令 的 条 件 或 无 条 件 转移 指令 。L. nextlist 的 定义 与 此 类 似 。 r 
考虑 图 6-46 中 的 语义 动作 (3 ) 。 产 生 式 S—while (B) 51 的 代码 布局 如 图 635c PAR. HIE © 
非 终结 符号 M 在 产生 式 ci 





S—while M, (B) M, S; i 

中 的 两 次 出 现 分 别 记录 了 8B 的 代码 和 3; 的 代码 的 开始 处 的 指令 编号 。 它 们 分 别 对 应 于 图 6-35¢ Se 

中 的 标号 begin 和 B. true, 

呆 还 是 只 有 唯一 的 产生 式 Me, El 6-46 中 的 动作 (6) 将 属性 M. insir 的 值 设 为 下 一 条 指令 ， 

的 序号 。 在 while 语句 的 循环 体 S 执行 之 后 , 控制 流 回 到 此 语句 的 起 始 位 置 。 因 此 , 在 将 while 

M,(B) M, S, 归 约 为 $ 的 时 候 , 我 们 对 51. nextlist 中 的 所 有 跳 转 指令 进行 回填 ,使 得 该 列表 中 所 . 

有 指令 的 目标 为 序号 My. instr, TES, 的 代码 之 后 显 式 地 插 人 了 一 条 跳 转 到 B 的 代码 的 开始 处 

指令 , 这 是 因为 控制 流 也 有 可 能 “穿越 底部 ”。 通 过 将 B. truelist 中 的 指令 设置 为 转向 M). instr, 
们 将 B. truelist 回填 为 S, 代码 的 起 始 位 置 。 

在 为 条 件 语 句 if(B) S, else S, 生成 代码 时 , 我 们 可 以 看 到 更 加 有 说 服 力 的 使 用 S. nextlist 

L. nextlisi 的 理由 。 如 果 控制 流 “ 穿 越 * 了 5, 的 代码 的 底部 , 比如 当 51 是 一 个 赋值 语句 时 就 会 发 
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”这样 的 事情 , 我 们 必须 在 51 的 代码 之 后 增加 一 条 越过 S 代码 的 跳 转 指令 。 我 们 使 用 位 于 S 之 

后 的 另 一 个 标记 非 终结 符号 来 生成 这 个 跳 转 指 令 。 假 定 这 个 标记 非 终结 符号 为 N, 且 其 产生 式 为 
Neéo N 有 属性 N. nextlist， 它 是 一 个 由 N 的 语义 动作 (7) 生 成 的 跳 转 指令 goto _ 的 序号 组 成 的 
列表 。 


1) S + if(B) ALS, { backpatch(B.truelist, M.instr); 
S.nertlist = merge(B.falselist, S\.nextlist); } 


2) S> if€B) At, S| N else My Sy 
{ backpatch(B.truelist, Mhi .instr); 
backpatch(B falselist, M».instr); 
temp = merge(Sy.nerilist, N.nextlist); 
S.neztlist = merge(temp, S2.neatlist); } 


3) So while Af, (B) MSi 
{ backpatch(S;.neztlist, My instr); 
backpatch(B.truelist, Mo. instr); 
S.nertlist = B.falselist; 
gen('goto’ Mi.instr); } 


4) S> {L} { S.nextlist = L.neztlist; } 

5) SAA; { S.neatlist = null; } 

6) Af > { Mu.instr = nextinstr; } 

DNE { N.neztlist = makelist(neztinstr), 
gen(‘goto _'); } 


8) Lol MS { backpatch(L, .nectlist, M.instr); 
L.nettlist = S.nextlist; } 





9) Los { L.nevtlist = S.nestlist; } 








图 6-46 语句 的 翻译 


图 6-46 中 的 语义 动作 (2) 处 理 满足 下 列 语法 的 if-else 语句 : 
S-—if (B) M, Sı N else M, S, 

我 们 将 对 应 于 B 为 真 的 跳 转 指令 回填 为 M1. insir, 也 就 是 51 的 代码 的 开始 位 置 。 类 似 地 , 我 
们 将 回填 那些 对 应 于 B 为 假 的 跳 转 指令 , 使 它们 跳 转 到 S, 的 代码 的 开始 位 置 。 列表 S. nextlist 包 
含 了 所 有 从 S MS 中 跳出 的 指令 , 也 包括 由 NN 产生 的 跳 转 指令 。( 变量 temp 是 仅 用 于 合并 列表 
的 临时 变量 。) 

语义 动作 (8) 和 (9 ) 处 理 语句 序列 。 在 
LL, MS 

RRR PT IOP RARE L 的 代码 之 后 的 是 5 的 开始 指令 。 因 此 , PR L. nextlist 被 回填 为 5 代 
码 的 开始 位 置 , BOE M. inser AU, TLs H, L ues 和 S. nextlist 相同 。 

请 注意 , 除了 语义 规则 (3) 和 (7) 之 外 , 这 些 语 义 规 则 中 的 任何 地 方 都 没有 产生 新 的 指令 。 
其 他 所 有 的 代码 都 是 由 赋值 语句 和 表达 式 相关 的 语义 动作 产生 的 。 我 们 根据 控制 流 进行 了 正确 
的 回填 , 因此 赋值 语句 和 布尔 表达 式 的 求 值 过 程 被 正确 地 连接 了 起 来 。 
6.7.4 break fj, continue 语句 和 goto 语句 

用 于 改变 程序 控制 流 的 最 基本 的 程序 设计 语言 结构 是 goto 语句 。 在 C 语言 中 , A goto Lik 
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样 的 语句 将 控制 流转 到 标号 为 荆 的 指令 一 一 在 相应 作用 域内 必须 恰好 存在 一 条 标号 为 的 语句 。 


标 之 后 进行 回填 。 

Java 废除 了 goto 语句 。 但 是 Java 支持 一 种 规范 化 的 跳 转 语句 ， 即 break 语句 。 它 使 控制 流 跳 
出 外 围 的 语言 结构 。Java 中 还 可 以 使 用 continue 语句 。 这 个 语句 的 作用 是 触发 外 围 循环 的 下 一 轮 
过 代 。 下 面 的 代码 摘自 一 个 语法 分 析 器 ， 它 说 明了 简单 的 break 语句 和 continue 语句 。 


1) for (; ;readch() ) { 

2) if( peek == ? > || peek == *\t’ ) continue; 
3) else if( peek == ’\n’ ) line = line + 1; 

4) else break; 

SF AF 


控制 流 会 从 第 4 行 中 的 break 语句 跳出 到 外 围 for- 循 环 之 后 的 下 一 个 语句 。 控 制 流 也 会 从 第 
2 行 中 的 continue 语句 跳 转 到 计算 reach( ) 的 代码 ， 然 后 再 转 到 第 2 行 中 的 这 语句 。 

如 果 S 表示 外 围 的 循环 结构 , 那么 一 条 break 语句 就 是 跳 转 到 S 代码 之 后 第 一 条 指令 处 的 跳 转 
指令 。 我 们 可 以 按照 下 面 的 步骤 为 break 生成 代码 : 跟踪 外 围 循环 语句 S, OHIA break 语句 生成 
未 完成 的 跳 转 指令 , @ 将 这 些 指令 放 到 S. nextlist 中 ， 其 中 nexilist 就 是 6.7.3 节 中 讨论 的 列表 。 

在 一 个 通过 两 趟 扫描 构建 抽象 请 法 树 的 编译 器 前 端 中 ，$. nextlist 可 以 被 实现 为 对 应 于 语句 5 
的 结 点 的 一 个 字段 。 我 们 可 以 在 符号 表 中 将 一 个 特殊 的 标识 符 break 瑞 射 为 表示 外 围 循环 语句 S 
的 结 点 ,以 此 来 跟踪 5。 这 种 方法 同样 可 以 处 理 java 中 带 标号 的 break 语句 ,因为 同样 可 以 用 符 
号 表 来 将 这 个 标号 映射 为 对 应 于 标号 所 指 的 结构 的 语法 树 结 点 。 

如 果 不 使 用 符号 表 来 访问 S 的 结 点 , 我 们 还 可 以 在 符号 表 中 设置 一 个 指向 S. nexilist 的 指针 。 
现在 当 遇 到 一 个 break 语句 时 , 我 们 生成 一 个 未 完成 的 跳 转 指令 ,并 通过 符号 表 查 找到 nextlist， 
然后 把 这 个 跳 转 指令 加 入 到 这 个 列表 中 。 这 个 nextlist 将 按照 6.7.3 节 中 讨论 的 方法 进行 回填 。 

continue 语句 的 处 理 方法 和 break 语句 的 处 理 方 法 类 似 。 两 者 之 间 的 主要 区 别 在 于 生成 的 跳 
转 指 令 的 目标 不 同 。 

6.7.5 6.7 节 的 练习 

练习 6.7. 1; 使 用 图 643 中 的 翻译 方案 翻译 下 列表 达 式 。 给 出 每 个 子 表达 式 的 truelist 和 

Jalselist。 你 可 以 假设 第 一 条 被 生成 的 指令 的 地 址 是 100。 


1) a==b && (c==d || e==f) 





2) (a==b || c==d) || e==f 

3) (a==b && c==d) && e==f 

练习 6.7.2: 图 6-47a 中 给 出 了 一 个 程序 的 摘要 。6-47b 概述 了 使 用 图 6-46 中 的 回填 翻译 方 
案 生 成 的 三 地 址 代码 的 结构 。 这 里 , i, ~ ig 是 每 个 code 区 域 的 第 一 条 被 生成 指令 的 标号 。 当 我 
们 实现 这 个 翻译 时 ,我 们 为 每 个 布尔 表达 式 五 维护 了 两 个 列表 , 表 中 给 出 五 的 代码 中 的 一 些 位 
置 。 我 们 分 别 用 五 true 和 fae 来 表示 这 两 个 列表 。 对 于 E. true 列表 中 的 那些 指令 位 置 , 我 们 
最 终 要 加 入 当 五 为 真 时 控制 流 应 该 到 达 的 语句 的 标号 。E. false 是 类 似 的 存放 特定 位 置 号 的 列表 ， 
我 们 要 在 这 些 位 置 上 加 入 当 发 现 E 为 假 时 控制 流 应 该 到 达 的 标号 。 同 时 , 我 们 还 为 语 旬 8 维护 
了 一 个 位 置 的 列表 。 我 们 必须 在 这 些 位 置 上 加 入 当 5 执行 完毕 之 后 控制 流 应 该 到 达 的 标号 。 请 
给 出 最 终 将 代 蔡 下 列 各 个 列表 中 的 位 置 的 值 ( 即 忆 ~is 中 的 某 个 标号 )。 

(1) Es.false (2) Sp. next (3) Ey. false (4) Sj. next (5) E,. true 

练习 6.7. 3: 当 使 用 图 6-46 中 的 翻译 方案 对 图 6-47 进行 翻译 时 , 我 们 为 每 条 语句 创建 
S. next 列表 。-- 开 始 是 赋值 语句 51 、S。 、$3 ,然后 逐步 处 理 越 来 越 大 的 让 语句 if-else 语句 、while < 
语句 和 诱 句 块 。 在 图 6-47 中 有 5 个 这 种 类 型 的 结构 语句 : 

S4: while( £3) Sio 
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Ss: if( Ea) S20 
Se: 包含 $s 种 53 的 语句 块 。 
Sy: Wa) if ( E, ) S4 else S5。 
Sg: 整个 程序 。 

















while (£1) { ip: Code for Ey 
if (£x) iy: Code for Eo 
while (£3) ix: Code for E; 
Si: ty: Code for Si 
else { is: Code for By 
if (Ea) tg: Code for S» 
So: iz: Code for $3 
S3 l igi 
} 
} 
a) b) 


图 6-47 练习 6.7.2 的 程序 的 控制 流 结构 
对 于 这 些 结构 语句 ， 我们 可 以 通过 一 -个 规则 用 其 他 的 Si. next 列表 以 及 程序 中 的 表达 式 的 列 
表 E, true 和 E,. false 构造 出 S; next。 给 出 计算 下 列 next 列表 的 规则 : 
(1) S4. next (2) Ss. next (3) Sg. next (4) Sz. next (5) Sg. next 
6.8 switch 语句 


很 多 语言 郡 使 用 * switch” BK“ case” 语句 。 我 们 的 switch 语句 的 语法 如 图 6-48 所 示 。 语 句 中 包 
含 一 个 待 求 值 的 选择 表达 式 E, 后 面 是 该 表达 式 可 能 取 的 n 个 常 





switch (FE) { 






BHA Vi, Vos, 内。 语句 中 也 可 能 包含 一 个 默认 * 值 *， 当 其 他 tae 

值 都 不 和 选择 表达 式 的 值 匹 配 时 ,就 用 这 个 默认 值 来 匹配 。 case 12: S} 

6.8.1 switch 语句 的 翻译 。 sen Gens 
一 个 switch 语句 的 预期 翻译 结果 是 完成 如 下 工作 的 代码 : default: S, 





1) 计算 表达 式 的 值 。 

2) 在 case 列表 中 寻找 与 表达 式 值 相同 的 值 WW。 回顾 一 下 ， ”图 6-48 Switch 语句 的 语法 
当 在 case 列表 中 明确 列 出 的 值 都 不 和 表达 式 匹 配 时 ， 就 用 默认 值 和 表达 式 丐 配 。 

3) 执行 和 匹配 值 关联 的 语句 8 。 

步骤 (2) 是 一 个 mn 路 分 支 , 它 可 以 采取 多 种 方法 实现 。 如 果 case 的 数 日 较 少 ,比如 不 多 于 10 
个 , 那么 可 以 使 用 一 个 条 件 跳 转 指令 序列 来 实现 。 每 一 个 条 件 跳 转 指令 都 测试 一 个 常量 值 , 并 跳 

转 到 这 个 值 对 应 的 语句 的 代码 。 

实现 这 个 条 件 跳 转 指令 序列 的 一 个 简洁 的 方法 是 创建 一 个 对 照 关 系 表 。 表 中 的 每 一 个 关系 
都 包含 了 一 个 常量 值 和 相应 语句 代码 的 标号 。 在 运行 时 刻 , 表达 式 自 身 的 值 以 及 默认 语句 的 标 
号 被 放 在 对 照 表 的 末端 。 编 译 器 生成 一 个 简单 循环 ,把 表达 式 的 值 和 表 中 的 每 个 值 进行 比较 。 
我 们 已 经 保证 了 当 找 不 到 其 他 匹配 时 , 最 后 一 个 条 目 ( 默 认 值 条 目 ) 一 定 会 嘴 配 。 

如 果 值 的 个 数 超过 10 个 或 更 多 , 那么 更 高 效 的 方式 是 为 这 些 值 构造 一 个 散 列 表 。 这 个 表 的 
条 目 是 各 个 分 支 语句 的 标号 。 如 果 没 有 找到 对 应 于 switch 表达 式 的 值 的 条 目 , 就 会 有 一 条 跳 转 指 
令 转 到 默认 语句 。 

还 有 一 种 常见 的 特殊 情况 , 它 的 实现 可 以 比 n 路 分 支 更 加 高 效 。 如 果 表 达 式 的 值 位 于 某 个 
较 小 的 范围 内 ,比如 从 min 到 max, 并 且 不 同 常 量 值 的 总 数 接近 max - min。 那 么 我 们 可 以 构造 一 
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个 包含 max - min AAT RA, 其 中 桶 j - min 包含 了 对 应 于 值 j 的 语句 的 标号 ; 任何 没有 被 填 
人 对 应 标号 的 “ 桶 " 中 包含 了 默认 标号 。 

执行 switch 语句 时 , 首先 计算 表达 式 并 获得 值 j; 检查 它 是 否 在 min 到 max 的 范围 之 内 , 如 是 
则 间接 跳 转 到 偏 移 量 为 j- min 的 条 目 中 的 标号 。 例 如 ,如 果 表 达 式 的 类 型 是 字符 型 ,我们 可 以 创 
建 一 个 包含 128 个 条 目 ( 根 据 具体 的 字符 集 , 条 目 个 数 可 有 不 同 ) 的 表 , 并 且 不 进行 范围 检查 直接 
进行 控制 流 跳 转 。 

6. 8.2 switch 语句 的 语法 制导 翻译 

图 6-49 中 的 中 间 代 码 是 图 6-48 中 的 switch 语句 的 一 个 近似 翻译 结果 。 所 有 的 测试 都 出 现在 
代码 的 末端 , 因此 一 个 简单 的 代码 生成 器 就 可 以 识别 出 多 路 分 支 , 并 使 用 本 节 开 始 时 介绍 的 多 种 
实现 方法 中 最 合适 的 实现 方法 来 生成 高 效 的 代码 。 

图 6-50 中 显示 的 是 一 个 更 直接 的 代码 序列 。 它 要 求 编译 器 进行 更 加 深入 的 分 析 , 才能 找到 
最 高 效 的 实现 。 值 得 注意 的 是 , 在 一 趟 式 编译 器 中 , 将 分 支 语句 放 在 开始 的 位 置 会 造成 不 便 , A 
为 编译 器 此 时 还 没有 碰 到 各 个 语句 5;, 无 法 生成 转向 各 个 语 甸 的 代码 。 

为 了 翻译 成 如 图 6-49 所 示 的 形式 ， 当 我 们 看 到 关键 字 switch 的 时 候 , 我 们 生成 两 个 新 标号 
test 和 next 以 及 一 个 临时 变量 to 然后 ， 当 我 们 对 表达 式 忆 进行 语法 分 析 的 时 候 , 生成 计算 五 
值 并 将 其 保存 到 上 的 代码 。 处 理 完 五 之 后 , 产生 跳 转 指令 goto test, 

当 我 们 看 见 各 个 case 关键 字 时 ,就 创建 一 个 新 的 标号 L;, 并 将 其 加 入 符号 表 。 我 们 将 在 一 
个 仅 用 于 存放 case 分 支 的 队列 中 放 人 一 个 值 -标号 对 。 这 个 值 - 标号 对 由 常量 值 V; AL; 
是 指向 符号 表 中 工 ; 的 条 目的 指针 ) 组 成 。 我 们 逐个 处 理 语句 case V: S;, 生成 附加 于 5; 的 代码 上 
的 标号 L;。 最 后 生成 跳 转 指 令 goto next. 


























code to evaluate Æ into t 
goto test 
Li: code for Sı r - 
goto next code to evaluate E into t 
La: code for S» if t != V, goto LI 
goto next code for Sy 
was goto next 
Ln): code for Sy-1 Lj: if t != V goto Ly 
goto next code for Sy 
Live code for Sn goto next 
goto next La: 
test: if t = Vi goto Li Ipe 
if t = V goto Lə Ly-zi if t != Va-1 goto Ln-1 
tee code for Sn_1 
if t = Vp- goto Ly- goto next 
goto Ln LI: code for Sn 
next: next: 
图 6-49 一 个 switch 语句 的 翻译 结果 图 6-50 ”一 个 switch 语句 的 另 一 种 翻译 
当 编 译 器 到 达 switch 语句 的 末端 时 , 我 们 已 经 可 以 生成 case t V Ly 
路 分 支 的 代码 了 。 读 取 值 -标号 对 的 队列 , 我 们 就 可 以 生 case t Vs Lə 
成 形 如 图 6-51 所 示 的 三 地 址 语句 序列 。 其 中 + 是 一 个 保存 选 edad 
=f Bopo 一 nF Ga 
FRAR E 的 值 的 临时 变量 , L, 为 默认 语句 的 标号 。 case tt Ln 
指令 case t V, L;i MA 6-49 中 的 if t=V; goto L & neyt: 








义 相 同 , 但 是 case 指令 更 加 容易 被 最 终 的 代码 生成 器 探测 。 图 6-51 用 来 翻译 switch 语句 的 
到 , 从 而 对 这 些 指令 进行 某 种 特殊 处 理 。 在 代码 生成 阶段 ， case 三 地 址 代码 指令 
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根据 分 支 的 个 数 以 及 这 些 值 是 否 在 一 个 较 小 的 范围 内 , 这 些 case 请 名 的 序列 可 以 被 翻译 成 最 高 
效 的 于 路 分 文 。 
6.8.3 6.8 节 的 练习 

| 练习 6. 8. 1: 为 将 switch 语句 翻译 成 一 个 如 图 6-51 所 示 的 case 语句 序列 ,翻译 器 需要 在 处 
J switch 语句 的 源 代 码 时 创建 一 个 由 值 - 标号 对 组 成 的 列表 。 我 们 可 以 使 用 一 个 附加 的 翻译 方 
案 来 做 到 这 一 点 ,这 个 方案 只 搜集 这 些 值 -标号 对 。 给 出 一 个 语法 制导 定义 的 概要 描述 。 该 
SDD 可 以 生成 值 -标号 对 照 表 ,同时 还 为 各 个 语句 5; 生成 代码 。 这 里 的 5; 是 各 个 case 对 应 的 
动作 。 


6. 9 ”过程 的 中 间 代码 


过 程 及 其 实现 将 在 第 7 章 中 与 运行 时 刻 的 变量 存储 管理 一 并 详细 地 讨论 。 本 节 我 们 使 用 术 
语 “函数 "来 表示 带 有 返回 值 的 过 程 。 我 们 将 简单 讨论 函数 声明 以 及 函数 调用 的 三 地 址 代码 。 在 
三 地 址 代码 中 ,函数 调用 被 拆 分 为 准备 进行 调用 时 的 参数 求 值 , 然后 是 调用 本 身 。 为 简单 起 见 ， 
我 们 假定 参数 使 用 值 传递 的 方式 。1. 6. 6 节 中 曾 讨 论 过 参数 传递 方法 。 
URA bod 。 是 一 个 整数 数组 ,并且 上 是 一 个 从 整数 到 整数 的 函数 。 那 么 赋值 语句 

n=f(ali]); 
可 以 被 翻译 成 如 下 的 三 地 址 代码 。 
3) param ty 


4) t = call f, 1 


5) n = tz 


如 6.4 节 中 讨论 的 , 前 两 行 计算 表达 式 a[ i] 的 值 , 并 将 结果 存放 到 临时 变量 t。 中 。 第 3 行 
将 ts 作为 实在 参数 用 于 第 4 行 中 对 £ 的 调用 。 这 个 调用 只 带 有 一 个 参数 。 第 4 行 中 函数 调用 的 
返回 值 被 赋 给 ts 。 第 5 行将 返回 值 赋 给 no E 

图 6-52 中 的 产生 式 可 以 生成 函数 定义 和 函数 调用 。( 这 











个 文法 会 在 最 后 一 个 参数 之 后 生成 一 个 不 必要 的 逗号 , 但 是 eee 
它 已 经 足以 说 明 翻 译 的 方法 了 。) 如 6. 3 节 所 述 , 非 终 结 符号 D | 。 ‘tom. 

和 了 分 别 生成 声明 和 类 型 。 由 D 生成 的 函数 定义 包含 了 关键 p o id(A) 

F define、 返 回 类 型 、 函 数 名 、 括 号 中 的 形式 参数 以 及 由 一 个 | 4 a 6 | ELA 











位 于 花 括 号 中 的 语句 组 成 的 函数 体 。 非 终结 符号 玉生 成 0 个 
或 多 个 形式 参数 ,每 个 形式 参数 包括 一 个 类 型 和 一 个 标识 符 。 图 6-52 在 源 语 言 中 加 入 函数 
非 终 结 符号 S 和 分别 生成 语句 和 表达 式 。5 的 产生 式 增加 了 一 条 返回 表达 式 值 的 语句 。E 的 产 
生 式 中 增加 了 函数 调用 , 调用 中 的 实在 参数 由 4 生成 。 一 个 实在 参数 就 是 一 个 表达 式 。 
函数 定义 和 函数 调用 可 以 用 本 章 中 已 经 介绍 过 的 概念 进行 翻译 。 
© 函数 类 型 。 一 个 函数 类 型 必须 包含 它 的 返回 值 类 型 和 形式 参数 类 型 。 令 void 是 一 个 表示 
没有 参数 或 没有 返回 值 的 特殊 类 型 。 因 此 , 返回 一 个 整数 的 函数 pop( ) 的 类 型 是 “从 void 
到 integer 的 函数 " 。 函 数 类 型 可 以 在 返回 值 类 型 和 有 序 的 参数 类 型 列表 上 应 用 构造 算 子 
fuin 来 表示 。 
© 符号 表 。 设 编译 器 处 理 到 一 个 函数 定义 时 ,最 上 层 的 符号 表 为 s。 函 数 名 被 放 人 s, 以 便 
在 程序 的 其 他 部 分 使 用 。 函 数 的 形式 参数 可 以 用 类 似 于 记录 字段 名 的 方式 来 处 理 ( 见 图 
6-18), Æ D 的 产生 式 中 , 在 看 到 关键 字 define 和 函数 名 之 后 , 我 们 将 s 压 栈 并 建立 新 的 
符号 表 











e 


Env.pushl lop), top = new Ene(top); 
ASIRIA to ER, top 被 作为 参数 传递 到 new Env( top) , REIRE He 上 可 
以 被 链接 到 先前 的 符号 表 *。 新 的 符号 表 上 FTI TY AYE, CEI PS RK 
被 翻译 完成 之 后 ,我们 恢复 到 先前 的 符号 表 so 


类 型 检查 。 在 表达 式 中 , 一 个 函数 和 运算 符 的 处 理 方法 相同 。 因 此 在 6.5.2 节 中 讨论 的 
类 型 检查 规则 (包括 自动 类 型 转换 ) 仍然 可 用 。 例 如 ,， 如果/ 是 一 个 带 有 一 个 实数 型 参数 
的 函数 , MAERA, 整数 2 将 被 转换 成 实 型 数 。 

函数 调用 。 当 为 一 个 函数 调用 id(E, E e, 五 ) 生 成 三 地 址 指令 的 时 候 ， 只 需要 生成 对 各 


个 参数 EE 求 值 的 三 地 址 指令 , 或 者 生成 将 各 个 参数 E 归 约 为 地 址 的 三 地 址 指令 , 然后 理 
为 每 个 参数 生成 一 条 param 指令 即 可 。 如 果 我 们 不 愿 将 参数 计算 指令 和 param 指令 混 
在 一 起 , 可 以 将 每 个 表达 式 E 的 属性 addr 存放 到 一 个 数据 结构 (比如 队列 ) 中 。 一旦 所 
有 的 表达 式 都 翻译 完成 , 我 们 就 可 以 在 清空 队列 的 同时 生成 param 指令 。 


- 程 是 程序 设计 语言 中 重要 且 常 用 的 编程 结构 , 因此 编译 器 必须 为 过 程 调用 和 返回 生成 良 


过 


好 的 代码 。 用 于 处 理 过 程 的 参数 传递 、 调 用 和 返回 的 运行 时 刻 例 程 是 运行 时 刻 支 持 系统 的 一 部 
分 。 运 行 时 刻 支持 机 制 将 在 第 7 章 中 讨论 。 


6. 10 


第 6 章 总 结 


本 章 中 介绍 的 技术 可 以 被 综合 起 来 , 构造 一 个 简单 的 编译 右前 端 , 比如 附录 A 中 的 那个 编译 
器 前 端 。 编 译 器 的 前 端 可 以 增 量 式 地 进行 构造 : 


@ 





选择 一 个 中 间 表 示 形 式 : 中 间 表 示 形 式 通常 是 一 个 图 形 表示 方法 和 三 地 址 代码 的 组 合 。 
比如 在 语法 树 中 , 图 中 的 结 点 表示 一 个 程序 构造 ; 而 各 个 子 结 点 表示 其 子 构造 。 三 地 址 
代码 的 名 字源 于 它 的 x=y op z 的 形式 。 每 条 指令 至 多 有 一 个 运算 符 。 另 外 还 有 一 些 用 于 
控制 流 的 三 地 址 指令 。 

翻译 表达 式 : 通过 在 各 个 形 如 EE op E, 的 产生 式 中 加 入 语义 动作 , 带 有 复杂 运算 的 表 
达 式 可 以 被 分 解 成 一 个 由 单一 运算 组 成 的 序列 。 这 些 动 作 或 者 创建 一 个 E 的 结 点 , 此 结 
点 的 子 结 点 为 Bl ME, 或 者 生成 一 条 三 地 址 指令 , 该 指令 对 M E, 的 地 址 应 用 运算 符 
op, 并 将 其 运算 结果 放 入 一 个 临时 变量 中 。 这 个 临时 变量 就 成 了 的 地 址 。 l 
HEA: 一 个 表达 式 E op E, 的 类 型 是 由 运算 符 op AR E, ME, 的 类 型 决定 的 。 自 动 
类 型 转换 (coercion) 是 指 隐 式 的 类 型 转换 ,例如 从 integer 转换 到 .oa 。 中 间 代 码 中 还 包含 
了 显 式 的 类 型 转换 ， 以 保证 运算 分 量 的 类 型 和 运算 符 的 期 待 类 型 精确 匹配 。 

使 用 符号 表 来 实现 声明 : 一 个 声明 指定 了 一 个 名 字 的 类 型 。 一 个 类 型 的 宽度 是 指 存 放 该 
类 型 的 变量 所 需要 的 存储 空间 。 使 用 宽度 , 一 个 变量 在 运行 时 刻 的 相对 地 址 可 以 计算 为 
相对 于 某 个 数据 区 域 的 开始 地 址 的 偏 移 量 。 每 个 声明 都 会 将 一 个 名 字 的 类 型 和 相对 地 址 
放 人 符号 表 , 这 样 当 这 个 名 字 后 来 出 现在 一 个 表达 式 中 时 ,翻译 器 就 可 以 获取 这 些 信息 。 
将 数组 扁平 化 : 为 实现 快速 访问 , 数组 元 素 被 存放 在 一 段 连续 的 空间 内 。 数 组 的 数组 可 
以 被 扁平 化 , 当 作 各 个 元 素 的 一 维 数组 进行 处 理 。 数 组 的 类 型 用 于 计算 一 个 数组 元 索 相 
对 于 数组 基地 址 的 偏 移 量 。 

为 布尔 表达 式 产生 跳 转 代码 : 在 短路 (或 者 说 跳 转 ) 代码 中 , 布尔 表达 式 的 值 被 隐 含 在 代 
码 所 到 达 的 位 置 中 。 央 为 布尔 表达 式 B 常常 被 用 于 决定 控制 流 , 例如 在 过 (8)S 中 就 是 这 
样 , 因此 跳 转 指令 是 有 用 的 。 只 要 使 得 程序 正确 地 跳 转 到 代码 t = true 或 = flase 
处 , 就 可 以 计算 出 布尔 值 , 其 中 的 1 是 一 个 临时 变量 。 使 用 跳 转 标号 , 通过 继承 对 应 于 一 
个 布尔 表达 式 的 真 假 出 口 的 标号 , 就 可 以 对 布尔 表达 式 进行 翻译 。 常 量 true 和 false 分 别 




















中 ARER 273 
被 翻译 成 跳 转 到 真 值 出 日 各 假 值 出 口 的 指令 。 

o 用 控制 流 实现 语句 ; 通过 继承 next 标号 就 可 以 实现 语句 的 翻译 , 其 中 next 标记 了 这 个 语 
名 的 代码 之 后 的 第 一 条 指令 。 翻 译 条 件 语 句 Sif (B)S, 时 ， 只 需要 将 一 个 标记 了 5, 的 
代码 起 始 位 置 的 新 标号 和 5. next 分 别 作 为 8 的 真 值 出 白 和 假 值 出 白 传 递 给 其 他 处 理 
程序 。 

o 可 以 选择 使 用 回填 技术 : 回填 是 一 种 为 布尔 表达 式 和 语句 进行 一 趟 式 代 码 生成 的 技术 。 
其 基本 思想 是 维护 多 个 由 不 完整 跳 转 指令 组 成 的 列表 , 在 同一 列表 中 的 指令 具有 同样 的 
跳 转 目标 。 当 目标 位 置 已 知 时 ,将 为 相应 列表 中 的 所 有 指令 填 人 这 个 目标 。 

© 实现 记录 : 记录 或 类 中 的 字段 名 可 以 当 作 声明 序列 进行 处 理 。 一 个 记录 类 型 包含 了 关于 
它 的 各 个 域 的 类 型 和 相对 地 址 的 信息 。 可 以 使 用 一 个 符号 表 对 象 来 实现 这 个 县 的 。 


6.11 第 6 章 参 考 文献 
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产生 的 时 候 , 生成 中 间 代 和 码 的 语法 制导 翻译 技术 已 经 很 成 熟 Jo 

从 20 世纪 50 年 代 开 始 , 人 们 就 开始 寻求 一 种 虚构 的 中 间 语 言 JNCOL( 面向 所 有 编译 器 
的 语言 )。 如 果 有 一 个 UNCOL, 我 们 可 以 把 针对 -种 给 定 的 源 语言 的 前 端 和 和 针对 一 种 给 定 日 标语 
言 的 后 端 连接 起 来 , 构建 出 一 个 编译 器 [10]。 报 告 [10] 中 的 指导 性 技术 常常 用 于 将 编译 器 重 
定向 。 




















人 们 用 很 多 种 方法 来 实现 UNCOL 思想 , 即将 多 个 前 端 和 后 端 混 合并 相互 匹配 。 一 个 可 重 定 
目标 的 编译 器 包括 一 个 前 端 ， 该 前 端 可 以 和 不 同 的 后 端 结 合 起 来 ,以 便 在 不 同 机 器 上 实现 同一 种 
RERET Ao Nelia 请 言 是 一 个 带 有 重 定 的 早期 例子 , 这 个 编译 器 是 使 用 Neliac 
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[3] ,支持 包括 C、C ++ 、Objective-C、Fortran、Java、Ada 等 语言 的 前 端 。 
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Sle 运行 时 刻 环 境 


编译 器 必须 准确 地 实现 源 程序 语言 中 包含 的 各 个 抽象 概念 。 这 些 抽 象 概念 通常 包括 我 们 在 
1.6 节 中 曾经 讨论 过 的 那些 概念 ,如 名 字 、 作 用 域 、 绑 定 、 数 据 类 型 、 运 算 符 、 过 程 、 参 数 以 及 控 
制 流 构造 。 编 译 器 还 必须 和 操作 系统 以 及 其 他 系统 软件 协作 , 在 目标 机 上 支持 这 些 抽象 概念 。 

为 了 做 到 这 一 点 , 编译 器 创建 并 管理 一 个 运行 时 刻 环境 (run-time environment) ， 它 编译 得 到 
. 的 目标 程序 就 运行 在 这 个 环境 中 。 这 个 环境 处 理 很 多 事务 , 包括 为 在 源 程 序 中 命名 的 对 象 分 配 
和 安排 存储 位 置 ,确定 目标 程序 访问 变量 时 使 用 的 机 制 , 过 程 间 的 连接 , 参数 传递 机 制 , 以 及 与 
操作 系统 、 输 入 输出 设备 及 其 他 程序 的 接口 。 

本 章 的 两 个 主题 是 存储 位 置 的 分 配 和 对 变量 及 数据 的 访问 。 我 们 将 详细 地 讨论 存储 管理 ， 
包括 栈 分 配 、 堆 管理 和 垃圾 回收 。 我 们 将 在 下 一 章 中 介绍 为 多 种 常见 语言 构造 生成 目标 代码 的 
技术 。 

7.1 存储 组 织 

从 编译 器 编写 者 的 角度 来 看 , 正在 执行 的 目标 程序 在 它 自己 的 逻辑 地 址 空间 内 运行 , 其 中 每 
个 程序 值 都 在 这 个 空间 中 有 一 个 地 址 。 对 这 个 逻辑 地 址 空间 的 管理 和 组 织 是 由 编译 器 、 操 作 系 
统 和 目标 机 共同 完成 的 。 操 作 系 统 将 逻辑 地 址 映射 为 物理 地 址 , 而 物理 地 址 对 整个 内 存 空间 
编 址 。 


























一 个 目标 程序 在 嘱 辑 地 址 空间 的 运行 时 刻 映 像 包 含 。 [一 一 一 一 ss 
数据 区 和 代码 区 , 如 图 7-1 所 示 。 某 个 语言 (比如 C++ ) ae | 
在 某 个 操作 系统 ( 比如 Linux) 上 的 编译 器 可 能 按照 这 种 方 : Paani 
式 划分 存储 空间 。 peas _ 

在 本 书 中 , 我 们 假定 运行 时 刻 存 储 是 以 多 个 连续 字 | HE 
节 块 的 方式 出 现 的 ,其 中 字 节 是 内 存 的 最 小 编 址 单元 。 ar aie 
一 个 字 节 包含 8 个 二 进 制 位 , 4 个 字 节 构成 一 个 机 器 字 。 空闲 内 存 
多 字 节 数据 对 象 总 是 存储 在 一 段 连续 的 字 节 中 , 并 把 第 i 
一 个 字 节 作为 它 的 地 址 。 RE 














第 6 章 中 讨论 过 , 一 个 名 字 所 需要 的 存储 空间 大 小 是 
由 它 的 类 型 决定 的 。 基 本 数据 类 型 ， 比 如 字符 、 整 数 或 浮 ”图 7-1 运行 时 刻 内 存 被 划分 成 代码 
点 数 , 可 以 存储 在 整数 个 字 节 中 。 聚 合 类 型 ( 比如 数组 或 区 和 数据 区 的 典型 方式 
结构 ) 的 存储 空间 大 小 必须 足以 存放 这 个 类 型 的 所 有 分 量 。 

数据 对 象 的 存储 布局 受 目标 机 的 寻 址 约束 的 影响 很 大 。 在 很 多 机 器 中 ,执行 整数 加 法 的 指 
令 可 能 要 求 整数 是 对 齐 的 ， 也 就 是 说 这 些 数 必须 被 放 在 一 个 能 够 被 4 整除 的 地 址 上 。 尽 管 在 C 
语言 或 者 类 似 的 语言 中 一 个 有 10 个 字符 的 数组 只 需要 能 够 存放 10 个 字符 的 空间 , 但 是 编译 器 可 
能 为 了 对 齐 而 给 它 分 配 12 个 字 节 , 其 中 的 两 个 字 节 未 使 用 。 因 为 对 齐 的 原因 而 产生 的 闲置 空间 
称 为 补 白 (padding) 。 如 果 空 间 比较 紧张 ,编译 器 可 能 会 压缩 数据 以 消除 补 白 。 但 是 , 在 运行 时 
刻 可 能 需要 额外 的 指令 来 定位 被 压缩 数据 , 使 得 机 器 在 操作 这 些 数据 时 就 好 像 它 们 是 对 齐 的。 

生成 的 目标 代码 的 大 小 在 编译 时 刻 就 已 经 固定 下 来 了 , 因此 编译 器 可 以 将 可 执行 目标 代码 
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放 在 一 个 静态 确定 的 区 域 : 代码 区 。 这 个 区 通常 位 于 存储 的 低 端 。 类 似 地 , 程序 的 某 些 数据 对 象 
的 大 小 可 以 在 编译 时 刻 知道 , 它们 可 以 被 放置 在 男 一 个 称 为 静态 区 的 区 域 中 , 该 区 域 可 以 被 静态 
确定 。 放 置 在 这 个 区 域 的 数据 对 象 包括 全 局 常量 和 编译 器 产生 的 数据 ， 上 比如 用 于 支持 垃圾 回收 
的 信息 等 。 之 所 以 要 将 尽 可 能 多 的 数据 对 象 进行 静态 分 配 ， 是 因为 这 些 对 象 的 地 址 可 以 被 编译 
到 目标 代码 中 。 在 Fortran 的 早期 版 本 中 , 所 有 数据 对 象 都 可 以 进行 静态 分 配 。 

为 了 将 运行 时 刻 的 空间 利用 率 最 大 化 ,另外 两 个 区 域 一 一 栈 和 堆 被 放 在 剩余 地 址 空间 的 相 
对 两 端 。 这 些 区 域 是 动态 的 , 它们 的 大 小 会 随 着 程序 运行 而 改变 。 这 两 个 区 域 根据 需要 向 对 方 
增长 。 栈 区 用 来 存放 称 为 活动 记录 的 数据 结构 , 这 些 活 动 记录 在 函数 调用 过 程 中 生成 。 

在 实践 中 , 栈 向 较 低 地 址 方向 增长 , 而 堆 向 较 高 地 址 方向 增长 。 然 而 , 在 本 章 及 下 一 章 中 ， 
我 们 将 假定 栈 向 较 高 地 址 方向 增长 ,以便 我 们 能 够 在 所 有 例子 中 方便 地 使 用 正 的 偏 移 量 。 

我 们 将 在 下 一 节 看 到 , 一 个 活动 记录 用 于 在 一 个 过 程 调用 发 生 时 记录 有 关机 器 状态 的 信息 ， 
例如 程序 计数 器 和 机 器 寄存 器 的 值 。 当 控制 从 该 次 调用 返回 时 ,相关 寄存 器 的 值 被 恢复 , 程序 计 
数 器 被 设置 成 指向 紧 跟 在 这 次 调用 之 后 的 点 , 然后 调用 过 程 的 活动 就 可 以 重新 开始 。 如 果 一 个 
数据 对 象 的 生命 周期 包含 在 一 次 活动 的 生命 期 中 , 那么 该 对 象 可 以 和 其 他 关于 该 活动 的 信息 一 
起 被 分 配 到 栈 区 上 。 

很 多 程序 设计 语言 支持 程序 员 通 过 程序 控制 人 工分 配 和 回收 数据 对 象 。 例 如 ,C 语言 中 的 
malloc 和 free 了 清 数 可 以 用 来 获取 及 释放 任意 存储 块 。 堆 区 被 用 来 管理 这 种 具有 长 生命 周期 的 
数据 。7. 4 节 中 将 讨论 多 种 可 以 用 来 维护 堆 区 的 存储 管理 算法 。 
静态 和 动态 存储 分 配 

数据 在 运行 时 刻 环境 中 的 内 存 位 置 的 布局 及 分 配 是 存储 管理 的 关键 问题 。 这 些 问题 需要 谱 
慎 对 待 ,因为 程序 文本 中 的 同一 个 名 字 可 能 在 运行 时 刻 指 向 不 同 的 存储 位 置 。 两 个 形容 词 静态 
(static ) 和 动态 ( dynamic) 分 别 表示 编译 时 刻 和 运行 时 刻 。 如 果 编 译 器 只 需要 通过 观察 程序 文本 即 
可 做 出 某 个 存储 分 配 决定 ， 而 不 需要 观察 该 程序 在 运行 时 做 了 什么 ,我们 就 认为 这 个 存储 分 配 决 
定 是 静态 的 。 反 过 来 , 如 果 只 有 在 程序 运行 时 才能 做 出 决定 , 那么 这 个 决定 就 是 动态 的 。 很 多 编 
译 器 使 用 下 列 两 种 策略 的 某 种 组 合 进行 动态 存储 分 配 : 

1) 找 式 存储 。 一 个 过 程 的 局 部 名 字 在 栈 中 分 配 空 间 。 我 们 将 从 7. 2 节 开 始 讨论 “运行 时 刻 
栈 " 。 这 种 栈 支 持 通常 的 过 程 调 用 /返回 策略 。 

2) 推 存储 。 有 些 数据 的 生命 周期 要 比 创 造 它 的 某 次 过 程 调用 更 长 ,这些 数据 通常 被 分 配 在 
一 个 可 复 用 存储 的 “ 堆 ” 中 。 我 们 将 从 7.4 节 开 始 讨论 堆 管理 。 堆 是 虚拟 内 存 的 一 个 区 域 , 它 允 
许 对 象 或 其 他 数据 元 素 在 被 创建 时 获得 存储 空间 , 并 在 数据 变 得 无 效 时 释放 该 存储 空间 。 

为 了 支持 堆 区 管理 , 通过 “垃圾 回收 ”使 得 运行 时 刻 系 统 能 够 检测 出 无 用 的 数据 元 素 ， 即 使 
程序 员 没 有 显 式 地 释放 它们 的 空间 , 运行 时 刻 系统 也 能 够 复 用 这 些 存 储 。 尽 管 自动 垃圾 回收 机 
制 是 一 个 难以 高 效 完成 的 操作 , 但 它 仍 是 很 多 现代 程序 设计 语言 的 一 个 重要 特征 。 对 于 某 些 语 
言 来 说 , 垃圾 回收 其 至 是 不 可 能 完成 的 。 


7.2 空间 的 栈 式 分 配 


有 些 语 言 使 用 过 程 、 函 数 或 方法 作为 用 户 自 定义 动作 的 单元 , 几乎 所 有 针对 这 些 语言 的 编译 
器 都 把 它们 的 (至 少 一 部 分 的 ) 运行 时 刻 存储 按照 一 个 栈 进行 管理 。 每 当 一 个 过 程 3 被 调用 时 ， 








日 请 回忆 一 下 ,“ 过 程 " 这 个 词 是 亢 数 、 过 程 、 方 法 和 子 例 程 的 统称 。 
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用 于 存放 该 过 程 的 局 部 变量 的 空间 被 压 人 栈 ; 当 这 个 过 程 结 束 时 , 该 空间 被 弹出 这 个 栈 。 我 们 将 
看 到 , 这 种 安排 不 仅 允许 活 牙 时 段 不 交 病 的 多 个 过 程 调 用 之 间 共 享 空间 ,而且 人 允许 我 们 以 如 下 方 
式 为 一 个 过 程 编译 代码 ; 它 的 非 局 部 变 重 的 相对 地 址 总 是 周 定 的 ， 和 过 程 调用 的 序列 无 关 。 
7.2. 1 活动 树 

假如 过 程 调用 (或 者 说 过 程 的 活动 ) 在 时 间 上 不 是 嵌 套 的 ,那么 栈 式 分 配 就 不 可 行 了 。 下 面 
的 例子 说 明了 过 程 调用 的 搬 套 情形 。 
图 7-2 给 出 了 一 个 程序 的 概要 。 该 程序 将 9 个 整数 读 入 到 一 个 数组 a, 并 使 用 递归 的 快 
速 排序 算法 对 这 些 整 数 排序 。 





int a[iil; ‘ 

void readArray() { /* 将 9 个 整数 污 入 到 a|]],…. a 四 中 。*/ 
int i; 

} 


int partition(int m, int n) { 
/* GREASE ve ， 划 分 amn], 
使 得 alm. p~ iF e, ap] =e, 
HA aipt+lionj AF v. BA p. */ . 


} 
void quicksort(int m, int n) { 
int i; 
if (n>m) 4 
i = partition(m, n); 
quicksort(m, i-1); 
quicksort(it+i, n); 
ip 
} 
main() { 
readArray ()， 
a[0] = -9999; 
a[10] = 9999; 
quicksort (1,9); 
} 











图 72 一 个 快速 排序 程序 的 概要 
程序 的 主 函数 有 三 个 任务 。 它 调用 readhrray, REL PIR, 然后 在 整个 数组 之 上 调用 
quicksort。 图 7-3 给 出 了 可 能 在 程序 的 某 次 执行 中 得 到 的 调用 序列 。 在 这 次 执行 中 ,对 partition 
(1, 9) 的 调用 返回 4, 因此 a[1] 到 a[3] 存 放 了 小 于 被 选 定 的 分 割 值 v 的 元 素 ， 而 较 大 的 元 素 被 存 
放 在 al5] 到 a[9]。 
在 这 个 例子 中 , 过 程 活动 在 时 间 上 是 绕 套 的 , 在 一 般 情况 下 也 是 这 样 。 如 果 过 程 p 的 一 个 活 














1) g 的 该 次 活动 正常 结束 , 那么 基本 上 在 任何 语言 中 , 控制 流 从 p 中 调用 9 的 点 之 后 继续 。 

2) 4 的 该 次 活动 (或 9 调用 的 某 个 过 程 ) 直接 或 间接 地 中 止 了 , 也 就 是 说 不 能 再 继续 执行 了 。 
在 这 种 情况 下 , 9 和 同时 结束 。 

3) 4 的 该 次 活动 因为 9 不 能 处 理 的 某 个 异常 而 结束 。 过 程 p 可 能 会 处 理 这 个 异常 。 此 时 9 的 活 
动 已 经 结束 而 p 的 活动 继续 执行 , 尽管 的 活动 不 一 定 从 调用 4 的 点 开始 。 如 果 p 不 能 处 理 这 个 异 
常 , 那么 p 的 活动 和 4 的 活动 一 起 结束 。 一 般 来 说 某 个 过 程 的 尚未 结束 的 活动 将 处 理 这 个 异常 。 

因此 , 我 们 可 以 用 一 棵 树 来 表示 在 整个 程序 运行 期 间 的 所 有 过 程 的 活动 , 这 棵 树 称 为 活动 树 
(activation tree) 。 树 中 的 每 个 结 点 对 应 于 一 个 活动 , 根 结 点 是 启动 程序 执行 的 main 过 程 的 活动 。 
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在 表示 过 程 p 的 某 个 活动 的 结 点 上 , 其 子 结 点 对 应 于 被 p 的 这 次 活动 调用 的 各 个 过 程 的 活动 。 我 
们 按照 这 些 活动 被 调用 的 顺序 ， 自 左 向 右 地 显示 它们 。 值 得 注意 的 是 , 一 个 子 结 点 必须 在 其 右 兄 
第 结 点 的 活动 开始 之 前 结束 。 





一 种 快速 排序 

图 7-2 中 的 快速 排序 程序 概要 使 用 了 两 个 辅助 函数 readhrray 和 partition, PAA readArray 
仅 用 于 将 数据 加 载 到 数组 a 中 。 数 组 a 的 第 一 个 和 最 后 一 个 元 素 没有 用 于 存放 输入 数据 ,而 
是 用 于 存放 主 函 数 中 设 定 的 “ 限 值 ” 。 我 们 假定 a[0] 被 设 为 小 于 所 有 可 能 输入 数据 值 的 值 ， 
而 cf 10] 被 设 为 大 于 所 有 数据 值 的 值 。 

函数 partition 对 数组 中 第 m 个 元 素 到 第 n 个 元 索 的 部 分 进行 分 割 , 使 得 o[ mj] 到 al nj 之 
闻 的 小 元 素 存 放 在 前 面 ， 而 大 的 元 素 存放 在 尾部 , 但 是 这 两 组 内 部 不 一 定 是 排 好 序 的。 我 们 
将 不 会 探究 partition 的 工作 方式 ， 只 需要 知道 这 个 过 程 要 求 前 面 提 到 的 上 下 限 值 必须 存在 。 
图 9-1 中 的 更 加 详细 的 代码 给 出 了 实现 partition 的 一 种 可 能 的 算法 。 

递归 过 程 quicksort 首先 确定 它 是 否 需要 对 多 个 数组 元 素 进 行 排序 。 请 注意 ,单个 元 素 总 
是 “有 序 的 ”, 因此 在 这 种 情况 下 quicksort 不 需要 做 任何 事 。 如 果 有 和 多 个 元 素 需 要 排序 ,gquick- 
sort 首先 调用 partition。 这 次 调用 会 返回 一 个 数组 下 标 i, 它 是 小 元 素 和 大 元 素 之 间 的 分 界线 。 
然后 通过 递归 调用 quicksort 对 这 两 组 元 素 排 序 。 











URA 27-3 给 出 了 一 个 调用 和 返回 序列 , 而 图 7-4 中 显示 了 一 棵 完成 这 个 调用 /返回 序 








列 的 可 能 的 活动 树 。 各 个 函数 用 它 的 函数 名 的 第 一 个 [rer manO 

字母 表示 。 请 记 住 , 这 个 树 只 代表 了 一 种 可 能 性 , 因 enter readhrray() 

为 后 续 证 用 的 参数 会 有 不 同 ,并 且 各 个 分 支 上 的 调用 

次 数 会 受到 partition 的 返回 值 的 影响 。 口 enter partition(1,9) 
在 活动 树 和 程序 行为 之 间 存 在 下 列 多 种 有 用 的 对 aig eee ec 

应 关系 , 正 是 因为 这 些 关系 使 我 们 可 以 使 用 运行 时 

a enter quicksert@,2) 
1) 过 程 调用 的 序列 和 活动 树 的 前 序 遍 历 相对 应 。 


2) 过 程 返回 的 序列 和 活动 树 的 后 序 遍 历 相 对 应 。 ee 
3) 假定 控制 流 位 于 某 个 过 程 的 特定 活动 中 , 且 该 Teave manO 

过 程 活动 对 应 于 活动 树 上 的 某 个 结 点 N。 那 么 当前 尚 

未 结束 的 ( 即 活跃 的 ) 活动 就 是 结 点 N 及 其 祖先 结 点 ”图 73 图 7-2 中 程序 的 可 能 的 活动 序列 。 

对 应 的 活动 。 这 些 活 动 被 调用 的 顺序 就 是 它们 在 从 根 结 点 到 N 的 路 径 上 的 出 现 顺 序 。 这 些 活动 

将 按照 这 个 顺序 的 反 序 返回 。 
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FQ 7-4 表示 quicksort 的 某 次 运行 中 的 调用 的 活动 树 
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7.2.2 活动 记录 

过 程 调用 和 返回 通常 由 一 个 称 为 控制 乒 (control stack ) 的 运行 时 刻 栈 进行 管理 。 每 个 活 牙 的 
活动 都 有 一 一 个 位 于 这 个 控制 栈 中 的 活动 记录 (activation record， 有 时 也 称 为 帧 (frame) ) 。 活动 树 
的 根 位 于 栈 底 , 栈 中 全 部 活动 记录 的 序列 对 应 于 在 活动 树 中 到 达 当 前 控制 所 在 的 活动 结 点 的 路 
径 。 程 序 控制 所 在 的 活动 的 记录 位 于 栈 顶 。 
Vive) 如 果 当 前 的 控制 位 于 图 7-4 的 树 中 的 活动 4(2, 3) 上 , 那么 4(2, 3) 对 应 的 活动 记录 在 
控制 栈 的 顶端 。 紧 跟 在 下 面 的 是 4(1, 3) 的 活动 记录 , 即 树 中 4(2, 3) 的 父 结 点 。 再 下 面 是 (1, 


9) 的 活动 记录 。 栈 的 底 端 是 主 函 数 m 的 活动 记录 , 也 就 是 活动 树 的 根 。 口 
按照 惯例 ,我 们 在 画 控制 栈 的 时 候 将 把 栈 底 画 在 栈 项 之 上 。 因 此 在 一 个 活动 记录 中 出 现在 


页 面 最 下 方 的 元 素 实际 上 最 靠近 栈 项 。 

根据 所 实现 语言 的 不 同 , 其 活动 记录 的 内 容 也 有 所 不 同 。 这 里 列举 出 可 能 出 现在 一 个 活动 
记录 中 的 各 种 类 型 的 数据 (图 7-5 列 出 了 这 些 元 素 以 及 它们 之 间 的 可 能 顺序 ) : 

1) 临时 值 。 比 如 当 表达 式 求 值 过 程 中 产生 的 中 间 结 果 无 法 存放 在 寄存 器 中 时 ,就 会 生成 这 
些 临时 值 。 

2) 对 应 于 这 个 活动 记录 的 过 程 的 局 部 数据 。 

3) 保存 的 机 器 状态 , 其 中 包括 对 此 过 程 的 此 次 调用 之 前 的 机 器 状态 信息 。 这 些 信息 通常 包 
括 返 回 地 址 (程序 计数 器 的 值 , 被 调用 过 程 必须 返回 到 该 值 所 指 位 置 ) 和 一 些 寄存 器 中 的 内 容 ( 调 
用 过 程 会 使 用 这 些 内 容 , 被 调用 过 程 必须 在 返回 时 恢复 这 些 内 容 )。 

一 个 "访问 链 ” 。 当 被 调用 过 程 需要 其 他 地 方 ( 比如 另 





一 个 活动 记录 ) 的 某 个 数据 时 需要 使 用 访问 链 进行 定位 。 访 问 | 实在 参数 
链 将 在 7.3.5 节 中 讨论 。 | BEE 
5) 一 个 控制 链 (control link) ， 指 向 调用 者 的 活动 记录 。 控制 链 


6) 当 被 调用 函数 有 返回 值 时 , 要 有 一 个 用 于 存放 这 个 返 | 访问 链 
回 值 的 空间 。 不 是 所 有 的 被 调用 过 程 都 有 返回 值 , MEA, BP as, 





保存 的 机 器 状态 
们 也 可 能 倾向 于 将 该 值 放 到 一 个 寄存 器 中 以 提高 效率 。 | 
7) 调用 过 程 使 用 的 实在 参数 (actual parameter) 。 这 些 值 [ _. 局 部 数据 E 
通常 将 尽 可 能 地 放 在 寄存 器 中 ,而 不 是 放 在 活动 记录 中 , 因为 临时 变量 | 





放 在 寄存 器 中 会 得 到 更 好 的 效率 。 然 而 , 我 们 仍然 为 它们 预 贸 
了 相应 的 空间 ,使 得 我 们 的 活动 记录 具有 完全 的 通用 性 。 
图 7-6 给 出 了 当 控 制 流 在 图 7-4 所 示 的 活动 树 中 运行 时 运行 时 刻 栈 的 多 个 快照 。 这 些 
不 完整 的 树 中 的 虚线 指向 已 经 结束 的 活动 。 程 序 的 执行 随 着 过 程 main 的 一 次 活动 而 开始 。 因 为 
数组 a 是 全 局 的 , 在 此 之 前 已 经 为 a 分 配 了 存储 空间 , 如 图 7- 6a 所 示 。 

当 控制 到 达 main 的 函数 体 中 的 第 一 个 函数 调用 时 ， 过 程 "被 激活 , 它 的 活动 记录 被 压 人 术 
中 (参见 图 7-6b) 。r 的 活动 记录 包含 了 局 部 变量 ; 的 空间 。 请 记 住 栈 顶 是 在 图 的 下 方 。 当 控制 从 
这 次 活动 中 返回 时 ， 它 的 记录 被 弹出 栈 , 栈 中 只 留 下 main 的 记录 。 

然后 控制 到 达 实 在 参数 为 1 和 9 的 对 9( 即 快速 排序 ) 的 调用 ,这 次 调用 的 活动 记录 被 放置 在 
栈 顶 , 如 图 7- 6c 所 示 。g 的 活动 记录 中 包括 了 参数 m 和 以 及 局 部 变量 i 的 空间 。 它 们 按照 图 
7-5 所 示 的 通用 布局 放置 。 请 注意 , 曾经 被 7 的 调用 使 用 的 空间 被 复 用 了 。 函 数 调用 g(1, 9) 没 有 
任何 方法 找到 7 的 局 部 数据 。 当 g(1, 9) 返 回 时 , 栈 中 再 次 只 剩 下 了 main 的 活动 记录 。 


图 7-5 一 个 概括 性 的 活动 记录 
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c) 和 被 弹出 栈 ,9(1, 9) 被 庄 栈 d) 控制 返回 到 g0, 3) 


图 7-6 向 下 增长 的 活动 记录 栈 


在 图 7-6 的 最 后 两 个 快照 之 间 发 生 了 多 个 活动 。9(1, 9) 递 归 地 调用 了 (1, 3)。 在 ga(1, 3) 
的 生命 期 内 , 活动 p(1, 3) 和 g(1, 0) 开始 执 行 并 结束 ， 栈 项 只 留 下 了 活动 记录 (1, 3)( 见 图 
7-6d) 。 注 意 ， 当 一 个 过 程 是 递归 的 时 , 常常 会 有 该 过 程 的 多 个 活动 记录 同时 出 现在 栈 中 。 口 
7.2.3 调用 代码 序列 

实现 过 程 调用 的 代码 段 称 为 调用 代码 序列 (calling sequence) 。 这 个 代码 序列 为 一 个 活动 记录 
在 栈 中 分 配 空间 , 并 在 此 记录 的 字段 中 填写 信息 。 返 回 代 码 序 列 (retum sequence) 是 一 段 类 似 的 
代码 , 它 恢 复 机 器 状态 , 使 得 调用 过 程 能 够 在 调用 结束 之 后 继续 执行 。 

即使 对 于 同一 种 语言 , 不 同 实现 中 的 调用 代码 序列 和 活动 记录 的 布局 也 可 能 千差万别 。 一 个 调 
用 代码 序列 中 的 代码 通常 被 分 割 到 调用 过 程 (调用 者 ) 和 被 调用 过 程 ( 被 调用 者 ) 中 。 在 分 割 运行 时 
刻 任 务 时 , 调用 者 和 被 调用 者 之 间 不 存在 明确 界限 。 源 语言 、 目 标 机 器 、 操 作 系统 会 提出 某 些 要 求 ， 
使 得 能 够 选择 出 一 种 较 好 的 分 割 方案 。 总 的 来 说 , 如 果 一 个 过 程 在 n 个 不 同 点 上 被 调用 , 分 配给 调 
用 者 的 那 部 分 调用 代码 序列 会 被 生成 nn 次。 然而 , 分 配给 被 调用 者 的 部 分 只 被 生成 --- 次 。 因 此 , 我 
们 期 望 把 调用 代码 序列 中 尽 可 能 多 的 部 分 放 在 被 调用 者 中 一 一 能 够 根据 被 调用 者 的 信息 确定 的 部 
分 都 应 该 放 到 被 调用 者 中 。 不 过 , 我 们 将 看 到 , 被 调用 者 不 可 能 知道 所 有 的 事情 。 

在 设计 调用 代码 序列 和 活动 记录 的 布局 时 , 可 以 使 用 下 列 的 设计 原则 : 

1) 在 调用 者 和 被 调用 者 之 间 传 递 的 值 一 般 被 放 在 被 调用 者 的 活动 记录 的 开始 位 置 , 因此 它 
们 尽 可 能 地 靠近 调用 者 的 活动 记录 。 这 样 做 的 动机 是 , 调用 考 能 够 计算 该 次 调用 的 实在 参数 的 
值 并 将 它 放 在 自身 活动 记录 的 项 部 , 而 不 用 创建 整个 被 调用 者 的 活动 记录 , 其 至 不 用 知道 该 记录 
的 布局 。 不仅 如 此 , 它 还 使 得 语言 可 以 使 用 参数 个 数 或 类 型 可 变 的 过 程 ,比如 C 语言 中 的 
printf 函数 。 被 调用 者 知道 应 该 把 返回 值 放置 在 相对 于 它 自己 的 活动 记录 的 哪个 位 置 。 同 时 ， 
不 管 有 多 少 个 参数 , 它们 都 将 在 栈 中 顺序 地 出 现在 该 位 置 之 下 。 

2) 固定 长 度 的 项 被 放置 存 中 间 位 置 。 根 据 图 7-5, 这 样 的 项 通常 包括 控制 链 、 访问 链 和 机 器 
状态 字段 。 如 果 每 次 调用 中 保存 的 机 器 状态 的 成 分 相同 , 那么 可 以 使 用 同一 段 代 码 来 保存 和 恢 

















和 运行 时 刻 环 境 28] 
复 每 次 调用 的 数据 。 不 仅 如 此 , 如 果 我 们 将 机 需 状 态 信息 标准 化 , A CARR ACHE, 诸如 调试 
器 这 样 的 程序 将 可 以 更 容易 地 将 栈 中 的 内 容 解码 。 

3) 那些 在 早期 不 知道 大 小 的 项 将 被 放置 在 活动 记录 的 尾部 。 大 部 分 局 部 变量 具有 图 定 的 长 度 ， 
编译 器 通过 检查 该 变量 的 类 型 就 可 以 确定 其 长 度 。 然 而 ,， 有 些 局 部 变量 的 大 小 只 有 在 程序 运行 时 才 
能 确定 。 最 常见 的 例子 是 动态 数组 ,数组 大 小 根据 被 调用 者 的 某 个 参数 决定 。 另 外 , 临时 量 所 需 空 
间 的 大 小 通常 依赖 于 代码 生成 阶段 能 够 将 多 少 临时 变量 放 在 寄存 器 中 。 关 此 , 虽然 编译 器 最 终 可 以 
知道 临时 变量 所 需要 的 空间 , 但 在 刚 开 始 生 成 中 间 代 码 时 可 能 并 不 知道 该 空间 的 大 小 。 

4) 我 们 必须 小 心地 确定 栈 顶 指针 所 指 的 位 置 。 一 个 常用 的 方法 是 让 这 个 指针 指向 活动 记录 
中 固定 长 度 字 段 的 末端 。 这 样 ， 国定 长 度 的 数据 就 可 以 通过 闫 定 的 相对 于 栈 顶 指针 的 偏 移 量 来 
访问 , 而 中 间 代 码 生 成 器 知道 这 些 偏 移 量 。 使 用 这 种 方法 的 后 果 是 活动 记录 中 的 变 长 域 实际 上 
位 于 栈 顶 “之 上 ”。 它 们 的 偏 移 量 需要 在 运行 时 刻 进行 计算 , 但 是 它们 仍然 可 以 基于 栈 顶 指针 进 
行 访问 , 但 是 偏 移 量 为 正 。 

图 7-7 给 出 了 调用 者 和 被 调用 者 如 何 合 作 管理 调用 栈 的 一 个 例子 。 寄 存 器 top_sp 指向 当前 的 
顶层 活动 记录 中 机 器 状态 字段 的 末端 。 调 用 者 知道 这 个 位 于 被 调用 者 的 活动 记录 中 的 位 置 。 因 
此 ， 调用 者 可 以 负责 在 控制 转向 被 调用 者 之 前 设 定 top_sp 的 值 。 这 个 调用 代码 序列 以 及 它 在 调用 
者 和 被 调用 者 之 间 的 划分 描述 如 下 : 

1) 调用 者 计算 实在 参数 的 值 。 

2) 调用 者 将 返回 地 址 和 原来 的 top_sp 值 存放 到 被 调用 者 的 活动 记录 中 。 然 后 , 调用 者 增加 
top_sp 的 值 , 使 之 指向 图 7-7 所 示 的 位 置 。 也 就 是 说 , top_sp 越过 了 调用 者 的 局 部 数据 和 临时 变量 
以 及 被 调用 者 的 参数 和 机 器 状态 字段 。 

3) 被 调用 者 保存 寄存 器 值 和 其 他 状态 信息 。 

4) 被 调用 者 初始 化 其 局 部 数据 并 开始 执行 。 
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717 ”调用 者 和 被 调用 者 之 间 的 任务 划分 


一 个 与 此 匹配 的 返回 代码 序列 如 下 : 

1) 如 图 7-5 所 示 , 被 调用 者 将 返回 值 放 到 与 参数 相 邻 的 位 置 。 

2) 使 用 机 器 状态 字段 中 的 信息 ,被 调用 者 恢复 top_sp 和 其 他 寄存 器 , 然后 跳 转 到 由 调用 者 
放 在 机 器 状态 字段 中 的 返回 地 址 。 

3) 尽管 top_sp 已 经 被 减 小 , 但 调用 者 仍然 知道 返回 值 相对 于 当前 top_sp 值 的 位 置 。 因 此, 调 














用 者 可 以 使 用 那个 返回 值 。 

上 面 的 调用 和 返回 代码 序列 支持 使 用 不 同 数量 的 参数 来 调用 同一 个 被 调用 程序 ( 就 像 C 语言 
中 的 printf 函数 那样) 。 请 注意 , 在 编译 时 刻 , 调用 者 的 目标 代码 知道 它 向 被 调用 者 提供 的 参 
数 的 数量 和 类 型 。 因 此 ,调用 者 知道 参数 区 域 的 大 小 。 然 而 , 被 调用 者 的 目标 代码 必须 还 能 处 理 
其 他 调用 , 因此 ， 它 要 等 到 被 调用 时 再 检查 相应 的 参数 字段 。 使 用 图 7.7 中 的 组 织 方法 ,描述 参 
数 的 信息 必定 放置 在 状态 字段 的 相 邻 位 置 ， 因 此 被 调用 者 可 以 找到 这 个 信息 。 例 如 , 在 C 语言 
printf 函数 中 , 第 一 个 参数 描述 了 其 余 的 参数 ,因此 一 旦 找到 了 第 一 个 参数 ,调用 者 就 可 以 找 
到 所 有 的 其 他 参数 。 

7.2.4 ”楼 中 的 变 长 数据 

运行 时 刻 存储 管理 系统 必须 频繁 地 处 理 某 些 数据 对 象 的 空间 分 配 。 这 些 数据 对 象 的 大 小 在 
编译 时 刻 未 知 , 但 是 它们 是 这 个 过 程 的 局 部 对 象 , 因而 可 以 被 分 配 在 运行 时 刻 栈 中 。 在 现代 程序 
设计 语言 中 , 在 编译 时 刻 不 能 决定 大 小 的 对 象 将 被 分 配 在 堆 区 。 堆 区 的 存储 结构 将 在 7. 4 节 中 讨 
论 。 不 过 ,也 可 以 将 未 知 大 小 的 对 象 、 数 组 以 及 其 他 结构 分 配 在 栈 中 。 我 们 在 这 里 将 讨论 如 何 进 
uci gh pais sia Gael Ue ele Ns tide ae : 
就 减少 了 相应 的 开销 。 注 意 ， 只 有 -- 个 数据 对 象 局 限于 某 个 过 程 , 且 当 此 过 程 结束 时 它 变 得 
访问 ， Penne nen = | 

为 变 长 数组 ( 即 其 大 小 依赖 于 被 调用 过 程 的 一 个 或 多 个 参数 值 的 数组 ) 分 配 空间 的 一 个 常用 
策略 如 图 7-8 所 示 。 同 样 的 方案 可 以 用 于 任何 类 型 的 对 象 的 分 配 , 只 要 它们 对 被 调用 的 过 程 而 计 
是 局 部 的 ， 并 且 其 大 小 依赖 于 该 次 调用 的 参数 即 可 。 

在 图 7-8 中 , 过程 有 三 个 局 部 数组 ,我 们 假设 它们 的 大 小 无 法 在 编译 时 刻 确 定 。 尽 管 这 些 
eT ee 
针 存 放 在 活动 记录 中 。 因 此 当 执行 时 ,这 些 指针 的 位 置 相对 于 楼 顶 指针 的 偏 移 量 是 已 知 的 ， 因 
而 目标 代码 可 以 通过 这 些 指针 访问 数组 元 素 。 
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图 7-8 访问 动态 分 配 的 数组 
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图 7-8 中 还 给 出 了 一 个 被 p 调用 的 过 程 9 的 活动 记录 。9 的 这 个 活动 记录 从 p 的 数组 之 后 开 
台 , 9 的 所 有 变 长 数组 被 分 配 在 9 的 活动 记录 之 外 。 

对 栈 中 数据 的 访问 通过 指针 top 和 top_sp 完成 。 这 里 , top 标记 了 实际 的 栈 顶 位 置 , 它 指 向 下 
一 个 活动 记录 将 开始 的 位 置 , 第 二 个 指针 top_sp 用 来 找到 顶层 活动 记录 的 局 部 的 定 长 字段 。 为 了 
和 图 7-7 保持 一 致 , 我 们 将 假定 top_sp 指向 机 器 状态 字段 的 末端 。 在 图 7-8 中 , top_sp 指向 g 的 活 
动 记录 的 机 器 状态 字段 的 末端 。 从 那里 ,我 们 可 以 找到 4 的 控制 链 字段 , 根据 这 个 字段 我 们 可 以 
知道 当 p 位 于 栈 顶 时 , top_sp 所 指 的 p 的 活动 记录 中 的 位 置 。 | 

重新 设置 top 和 top_sp 所 指 位 置 的 代码 可 以 在 编译 时 刻 生成 。 这 些 代码 根据 将 根据 在 运行 时 刻 
获知 的 记录 大 小 来 计算 top 和 top_sp 的 新 值 。 当 9 返回 时 , 可 以 根据 g 的 活动 记录 中 的 被 保存 的 控 
制 链 来 恢复 top_sp 的 值 。iop 的 新 值 等 于 (未 经 恢复 的 原来 的 )top_sp 值 减 去 g 的 活动 记录 中 机 器 状 
AS. 控制 链 、 访问 链 、 返 回 值 、 参 数字 段 (如 图 7-5 所 示 ) 的 总 长 度 。 调 用 者 可 以 在 编译 时 刻 知道 这 个 
KE, 尽管 当 调 用 参数 的 个 数 可 变 时 , 它 仍 取决 于 调用 者 ( 如果 调用 4 的 参数 个 数 可 变 ) 。 
7.2.5 7.2 节 的 练习 : 

练习 7.2. 1: 假设 图 7-2 中 的 程序 使 用 如 下 的 partition RI: 该 函数 总 是 将 al mj] 作为 分 割 值 
v。 同 时 假设 在 对 数组 alm], =, a[n] 重 新 排序 时 总 是 尽量 保存 原来 的 顺序 。 也 就 是 说 , 首先 是 
以 原 顺 序 保持 所 有 小 于 wv 的 元 素 , 然后 保存 所 有 等 于 4 的 元 素 , 最 后 按 原来 顺序 保存 所 有 大 于 ， 
的 元 素 。 

1) 画 出 对 数字 9、8、7、6、5、4、3、2、1 进行 排序 时 的 活动 树 。 

2) 同时 在 栈 中 出 现 的 活动 记录 最 多 有 和 多少 个 ? 

练习 7.2.2; 当初 始 顺序 为 1、3、5、7、9、2、4、6、8 时 , 重复 练习 7.2.1。 

练习 7.2.3: 图 19 中 是 递归 计算 Fiabonacci 数列 的 

















C 语言 代码 。 假 设 太 的 活动 记录 按 顺 序 包含 下 列 元 素 ; OGE ere ast, 
回 值 , 参数 ,局 部 变量 :, RAB) 。 通常 在 活动 记录 中 if (n < 2) return 1; 
还 会 有 其 他 元 素 。 下 面 的 问题 假设 初始 调用 是 /(5) 。 ee 

1) 给 出 完整 的 活动 树 。 return stt; 

2) 当 第 1 个 Ki) 调用 即将 返回 时 , 运行 时 刻 栈 和 其 
中 的 活动 记录 是 什么 样子 的 ? 图 7-9 练习 7.2.3 的 Fibonacci 程序 

”1 3) 当 第 5 个 态 1) 调 用 即将 返回 时 ,运行 时 刻 栈 和 

其 中 的 活动 记录 是 什么 样子 的 ? 

练习 7. 2.4: 下 面 是 两 个 C 语言 函数 /和 g 的 概述 : 

int f(int x) { int i; --- return i+i;... } 

~ int glint y) { int j; --- f£(j+t)--- } 


也 就 是 说 ,函数 g VALS. 画 出 在 g 调用 f 而 即将 返回 时 , 运行 时 刻 栈 中 从 g 的 活动 记录 开始 的 
顶端 部 分 。 你 可 以 只 考虑 返回 值 、 参 数 、 控 制 链 以 及 存放 局 部 数据 的 空间 。 你 不 用 考虑 存放 的 机 
器 状态 , 也 不 用 考虑 没有 在 代码 中 显示 的 局 部 值 和 临时 值 。 但 是 你 应 该 指出 : 

1) 哪个 函数 在 栈 中 为 各 个 元 素 创建 了 所 使 用 的 空间 ? 

2) 哪个 函数 写 人 了 各 个 元 素 的 值 ? 

3) 这 些 元 素 属 于 哪个 活动 记录 ? 

练习 7. 2. 5: 在 一 个 通过 引用 传递 参数 的 语言 中 , AP BRS, y) 完 成 下 面 的 计算 

x=x+1; y=y + 2; return xty; ; 


如 果 将 a 赋值 为 3, 然后 调用 f(a, a), 那么 返回 值 是 什么 ? 
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练习 7. 2.6: C 语言 隙 数 / 的 定义 如 下 : 
int f(int x, *py, **pp2z) { 
**ppz += 1; «py += 2; x += 3; return x+*pyt**pp2; 


变量 a 是 一 个 指向 的 指针 ; 变量 是 一 个 指向 c 的 指针 , 而 c 是 一 个 当前 值 为 4 的 整数 变量 。 
WRR, b, a), 返回 值 是 什么 ? 


7.3 栈 中 非 局 部 数据 的 访问 


在 本 节 中 , 我 们 将 探讨 过 程 如 何 访问 它们 的 数据 。 尤 其 重要 的 是 找到 在 过 程 p 中 被 使 用 但 又 
不 属于 p 的 数据 的 机 制 。 对 于 那些 可 以 在 过 程 中 声明 其 他 过 程 的 语言 , 这 种 访问 将 变 得 更 加 复 
杂 。 因 此 , 我 们 首先 从 C 函数 这 种 简单 情况 开始 , 然后 介绍 另 一 种 语言 ML, 该 语言 支持 嵌 套 的 
函数 声明 , 并 支持 将 函数 看 成 是 “一 阶 对 象 "” 。 也 就 是 说 , 函数 可 以 将 函数 作为 参数 ,并 把 函数 当 
做 值 返 回 。 通 过 修改 运行 时 刻 栈 的 实现 方法 就 可 以 支持 这 种 能 力 。 我 们 将 考虑 几 种 可 选 的 修改 
7.2 节 所 述 的 活动 记录 的 方法 。 

7.3.1 没有 娩 套 过 程 时 的 数据 访问 

在 C 系列 语言 中 , 各 个 变量 要 么 在 某 个 函数 内 定义 ,要 么 在 所 有 函数 之 外 (全 局 地 ) 定 义 。 
最 重要 的 是 , 不 可 能 声明 一 个 过 程 使 其 作用 域 完全 位 于 男 一 个 过 程 之 内 。 反 过 来 , 一 个 全 局 变量 
2 的 作用 域 包含 了 在 该 变量 声明 之 后 出 现 的 所 有 函数 , 但 那些 存在 标识 符 v 的 局 部 定义 的 地 方 除 
外 。 在 一 个 函数 内 部 声明 的 变量 的 作用 域 就 是 这 个 函数 , 或 者 像 在 1.6.3 节 中 讨论 过 的 那样 ,如 
果 该 函数 具有 戎 套 的 语句 块 ,， 这 个 变量 的 作用 域 可 能 是 该 函数 的 部 分 区 域 。 

对 于 不 允许 声明 髓 套 过 程 的 语言 而 言 , 变量 的 存储 分 配 和 访问 这 些 变量 是 比较 简单 的 : 

1) 全 局 变量 被 分 配 在 静态 区 。 这 些 变量 的 位 置 保持 不 变 , 并 且 在 编译 时 刻 可 知 。 因 此 要 访 
问 当前 正在 运行 的 过 程 的 非 局 部 变量 时 , 我 们 可 以 直接 使 用 这 些 静 态 确定 的 地 址 。 

2) 其 他 变量 一 定 是 栈 顶 活动 的 局 部 变量 。 我 们 可 以 通过 运行 时 刻 栈 的 top_sp 指针 来 访问 这 
些 变量 。 

对 于 全 局 变量 进行 静态 分 配 的 一 个 好 处 是 , 被 声明 的 过 程 可 以 作为 参数 传递 , 也 可 以 作为 结 
果 返 回 (在 C 语言 中 可 以 传递 指向 该 函数 的 指针 ), 实现 这 样 的 传递 不 需要 对 数据 访问 策略 做 出 
本 质 的 改变 。 使 用 C 语言 的 静态 作用 域 规则 且 不 允许 使 用 嵌 套 过 程 声明 时 , 一 个 过 程 的 任何 非 
局 部 变量 也 是 所 有 过 程 的 非 局 部 变量 , 不 管 这 些 过 程 是 如 何 被 激活 的 。 类 似 地 ,如果 一 个 过 程 作 
为 结果 返回 , 那么 任何 非 局 部 的 变量 都 指向 为 该 变量 静态 分 配 的 存储 位 置 。 : 
7.3.2 MREVRRKH Ae 

4 — ARGH PCE HR BE HS Ot RSE BOS SR BAS PEM, 数据 访问 变 得 
比较 复杂 。 也 就 是 说 , 根据 1. 6. 3 节 中 描述 的 针对 语句 抉 的 对 套 作用 域 规则 , 一 个 过 程 能 够 访 
问 另 一 个 过 程 的 变量 ,只 要 后 一 个 过 程 的 声明 包含 了 前 一 过 程 的 声明 即 可 。 其 原因 在 于 , M 
使 在 编译 时 刻 知道 p 的 声明 直接 嵌 套 在 4 之 内 , 我 们 并 不 能 由 此 确定 它们 的 活动 记录 在 运行 时 
刻 的 相对 位 置 。 实 际 上 , 因为 p 或 4 或 者 两 者 都 可 能 是 递归 的 , 在 栈 中 可 能 有 多 个 p 和 /或 9 的 
活动 记录 。 ， 

为 一 个 内 赃 过 程 p 中 的 一 个 非 局 部 名 字 % 找 出 对 应 的 声明 是 一 个 静态 的 决定 过 程 , 将 块 结构 
的 静态 作用 域 规则 进行 扩展 就 可 以 解决 这 个 问题 。 假 定 * 在 一 个 外 围 过 程 g 中 声明 。 根 据 p 的 一 
个 活动 找到 相关 的 4 的 活动 则 是 一 个 动态 的 决定 过 程 , 它 需 要 额外 的 有 关 活 动 的 运行 时 刻 信息 。 
这 个 问题 的 可 能 解决 方法 之 一 是 使 用 “访问 链 ” ,我 们 将 在 7.3.5 节 中 介绍 这 个 概念 。 
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7.3.3 —t*X PREV RRMA 
在 C 系列 语言 中 , DARE BLM ARREREN OE, ARAB 
的 语言 。 在 语言 中 支持 艇 套 过 程 的 历史 比较 长 。Alogl 60(C 语言 的 前 身 之 一 ) 就 具备 这 种 能 力 。 
Algol 60 语言 的 后 继 Pascal ( 一 个 一 度 很 流行 的 教学 语言 ) 也 支持 松 套 过 程 。 在 较 晚 的 支持 散 套 过 
程 的 语言 中 , 最 有 影响 力 的 语言 之 一 是 ML。 我 们 将 通过 这 个 语言 的 语法 和 语义 进行 相关 介绍 
(要 了 解 ML 的 一 些 有 趣 特 征 , 请 见 “ ML 的 更 多 特性 ”部 分 )。 
.e ML 是 一 种 函数 式 语言 (functional language), 这 意味 着 变量 一 旦 被 声明 并 初始 化 就 不 会 再 
改变 。 其 中 只 有 少数 几 个 例外 ， 比 如 数组 的 元 素 可 以 通过 特殊 的 函数 调用 改变 。 
定义 变量 并 设 定 它 们 的 不 可 更 改 的 初始 值 的 语句 具有 如 下 形式 : 
val (uame) = (expression) 
e PR AUN Pi REE TE NM : 
fun (name) ( (arguments) ) = (body) 
© 我 们 使 用 下 列 形式 的 let 语句 来 定义 函数 体 : 
let (list of definitions) in (statements) end 
其 中 , ENX (definition) 通常 是 val 或 fun 语句 。 每 个 这 样 的 定义 的 作用 域 包 括 从 该 定义 
之 后 直到 in 为 止 的 所 有 定义 , 以 及 直到 end 为 止 的 所 有 语句 。 最 重要 的 是 , KAO ME 
套 地 定义 。 例 如 , BE p 的 函数 体 可 能 包括 一 个 let 语句 ， 而 该 语句 又 包含 了 另 一 个 ( 褒 
套 的 ) 因数 g 的 定义 。 类 似 地 , 9 自身 的 函数 体 中 也 可 能 有 了 困 数 定义 ,这 就 形成 了 任意 深 
BE AY PR PRE o 
7.3.4 RERE 
RETA ABE CET ROR PEAR, 我 们 设 定 其 吝 套 深度 (nesting depth) 为 1。 例 如, 所 有 
C 函数 的 能 套 深度 为 1。 然 而 , 如 果 一 个 过 程 p HE— MRR EA i OTE PEM, 那么 我 们 设 定 
Pp 的 嵌 套 深度 为 ;+1。 
图 7-10 给 出 了 我 们 连续 使 用 的 快速 排序 例子 的 一 个 ML 程序 的 概要 。 唯 一 的 赔 套 深度 
为 1 的 函数 是 最 外 层 的 函数 sort。 它 读 和 人 一 个 有 9 个 整数 的 数组 a, 并 使 用 快速 排序 算法 对 它们 
进行 排序 。 在 sort 内 部 的 第 二 行 上 定义 了 数组 本 身 。 请 注意 ML 声明 的 形式 。array 的 第 一 个 
参数 说 明 我 们 要 求 该 数组 具有 11 个 元 素 。 所 有 的 ML 数组 的 下 标 都 是 从 0 开始 的 整数 ,因此 这 
个 数组 与 图 7-2 中 的 C 语言 数组 a 很 相似 。array 的 第 二 个 参数 说 明 数 组 a 中 的 所 有 元 素 的 初 
始 值 都 是 0。 因 为 0 是 整数 , 选择 这 样 的 初始 值 使 得 ML 编译 器 推断 出 a 是 一 个 整 型 数组 , 因此 
我 们 就 不 需要 为 a 声明 一 个 类 型 。 








ML 的 更 多 特性 l 
ML 几乎 是 纯 函 数 式 的 语言 。 除 此 之 外 ,ML 还 具有 多 个 令 那 些 熟 悉 CH C 系列 语言 的 程 
序 员 感 到 惊奇 的 特性 : 
e ML ZR E M k (higher-order function) 。 也 就 是 说 ,一 个 函数 可 以 将 函数 作为 参数 ， 
并 且 能 够 构造 并 返回 其 他 函数 。 而 这 些 国 数 又 可 以 将 函数 作为 参数 。 从 而 构造 出 任何 
层次 的 函数 。 
© ML 本 质 上 没有 像 C 中 的 for 和 while 语句 那样 的 迭代 语句 ， 而 是 通过 递归 来 达到 循环 的 
效果 。 这 种 方法 在 一 个 函数 式 语言 中 是 很 重要 的 , 因为 我 们 不 能 改变 迭代 变量 , 比如 C 
语言 中 的 “for (i =0; i <10; i++) Hih. MKSR i 作为 -个 函数 的 参数 ,该 
函数 将 用 不 断 增加 的 i 值 作为 参数 递归 地 调用 自身 ,直到 到 达 循 环 界限 为 止 。 
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e ML 将 列表 和 带 标号 的 树 结构 作为 其 基本 数据 类 型 。 

© ML 不 需要 声明 变量 的 类 型 。 准 确 地 说 , 它 在 编译 时 刻 推导 出 类 型 ,并 且 当 它 不 能 推导 
出 结果 时 就 将 其 作为 错误 处 理 。 例 如 ,val x =1 显然 使 得 x 具有 整数 类 型 ,并 且 如 果 
我 们 还 看 到 val y = 2 «x, 那么 我 们 就 知道 y 也 是 -- 个 整数 。 





在 sort 中 声明 的 函数 还 有 : readArray, exchange 和 quicksort。 在 第 (4) 行 和 第 (6) 行 中 , 我 们 说 
明 readArray 和 exchange 都 访问 了 数组 a。 请 注意 ,ML 中 的 数组 访问 可 能 违反 这 个 语言 的 函数 式 
特性 。 就 像 C 版 本 的 quicksort 中 那样 ,这 两 个 函数 实际 上 都 改变 了 a 中 元 素 的 值 。 因 为 这 三 个 函 
HME REE RED 1 的 函数 中 定义 的 , 所 以 它们 的 栓 套 深度 都 是 2。 

第 (7) 行 到 第 (11) 行 给 出 了 quicksort 的 一 些 细节 。 局 部 值 ( 即 分 划算 法 的 分 割 值 ) 在 第 8 行 
声明 。 第 (9) 行 则 给 出 了 函数 partition 的 定义 。 在 第 (10) 行 中 我 们 指出 parition 访问 了 数组 a All 
分 割 值 。, 并 且 还 调用 了 函数 exchange。 因 为 partition 直接 在 结 套 深度 为 2 的 函数 中 定义 , 所 以 其 





说 套 深 度 为 3。 第 (11) 行 表明 quicksort 访问 变量 a 和 vw 以 及 函数 partition, 并 递归 调用 其 自身 。 
第 (12) 行 表明 最 外 层 函 数 sort 访问 a, 并 调用 两 个 过 程 read4rray 和 quicksort, 口 
1) fun sort(inputFile, outputFile) = 
let 
2) val a = array(11,0); 
3) fun readArray(inputFile) = --- 
4) fe sept ote 
5) fun exchange(i,j) = 
6) 
7) fun quicksort(m,n) = 
let 
8) val vse j 
9) fun partition(y,z) = 
10) ‘ss a vores exchange --- 
in 
11) to) al. Vises partition --- quicksort 
end 
in 
12) ©- a... readArray --- quicksort --- 
| end; 








图 7-10 “ii FARE eB ML 风格 的 quicksort 版 本 









7.3.5 访问 链 ， 

针对 嵌 套 函数 的 通常 的 静态 作用 域 规则 的 一 个 直接 实现 方法 是 在 每 个 活动 记录 中 增加 一 个 
被 称 为 访问 链 (access link) 的 指针 。 如 果 过 程 P 在 源 代 码 中 直接 嵌 套 在 过 程 9 中 , 那么 p 的 任何 
活动 中 的 访问 链 都 指向 最 近 的 9 的 活动 。 请 注意 , 4 的 嵌 套 深度 一 定 比 p 的 嵌 套 深度 恰巧 少 1。 
访问 链 形成 了 一 条 链 路 ， 它 从 栈 顶 活动 记录 开始 ,经 过 嵌 套 深度 逐步 递减 的 活动 的 序列 。 沿 着 这 
条 链 路 找到 的 活动 就 是 其 数据 和 对 应 过 程 可 以 被 当前 正在 运行 的 过 程 访问 的 所 有 活动 。 

假定 栈 项 的 过 程 p 的 谋 套 深度 是 且 p 需要 访问 x, 而 x 是 在 某 个 包围 p 的 拱 套 深度 为 m 的 
过 程 g 中 定义 的 一 个 元 素 。 注 意 , n <n, HRX p 和 9 是 同一 个 过 程 时 两 者 相等 。 为 了 找到 *) 
我 们 从 位 于 栈 顶 的 p 的 活动 记录 开始 , 沿 着 访问 链 进行 n - mn 次 从 一 个 活动 记录 到 另 一 个 活动 
记录 的 查找 , 最 终 我 们 找到 了 q 的 活动 记录 。 这 一 定 是 当前 出 现在 在 栈 中 的 最 近 ( 即 最 高 ) 的 4 
的 活动 记录 。 这 个 活动 记录 中 包含 了 我 们 要 找 的 元 察 x。 因 为 编译 器 知道 活动 记录 的 布局 , 所 
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我 们 可 以 根据 最 后 一 个 访问 链 找到 4 的 活动 记录 中 的 某 个 位 置 , 而 x 就 位 于 和 这 个 位 置 具有 时 个 
固定 偏 移 量 的 位 置 上 。 

图 7-11 给 出 了 图 7-10 中 的 函数 sort 在 执行 时 可 能 得 到 的 栈 的 序列 。 同 以 前 一 样 , 我 们 
用 函数 名 的 第 一 个 字母 来 表示 函数 。 我 们 展示 了 某 些 可 能 在 不 同 活动 记录 中 出 现 的 数据 , 同时 
显示 了 每 个 活动 的 访问 链 。 在 图 7-11a 中 ,我们 看 到 的 是 sort 调用 readhrray 将 输入 加 载 到 数组 a 
上 后 再 调用 quicksort(1, 9) 对 数组 进行 排序 的 情形 。guicksort(1, 9) 中 的 访问 链 指向 sore 的 活动 记 
录 , 这 不 是 因为 sot 调用 了 quicksort, 而 是 因为 在 图 7-10 的 程序 中 ,sor 是 qucksort 外 围 的 最 靠近 
EMRE BRK, 




































































pase” nee | irae eee” 
ieee, igh i eon eget 
g(1, 9) g(Q,9) ) q(1, 9) th gq(1,9) 
-访问 链 mes M e | 访问 能 
aae [ ”| 访问 链 
v v v 1 \ 
j | 0Q:3) 93) | rd3 / | 
访问 链 访问 链 访问 链 
Be E Ssa e o N v 
D | p03) | | p03) | 
| 访问 链 | 访问 链 | 
Ey 
c) .eb,3) | 
访问 链 | 
La 
d) 


图 7-11 用 来 查找 非 局 部 数据 的 访问 链 


在 图 7-11 所 示 的 连续 步骤 中 , 我 们 看 到 对 quicksort(1, 3) 的 一 次 递归 调用 , 然后 是 对 partition 
的 调用 , 而 partition 又 调用 exchange, TITER, quicksort(1, 3) 的 访问 链 指向 sort, 其 理由 和 quick- 
sort(1, 9) 的 访问 链 指向 sort 的 理由 相同 。 

在 图 7-11d }, exchange 的 访问 链 绕 过 了 quicksort 和 partition 的 活动 记录 ， 因 为 exchange 直接 
REE sort 中 。 这 种 安排 是 合理 的 , 因为 exchange 只 需要 访问 数组 a, 而 它 要 对 换 的 两 个 元 素 由 
其 参数 i 和 j 指定 。 口 
7.3.6 处 理 访问 链 

如 何 确定 访问 链 呢 ?9 当 一 个 过 程 调用 另 一 个 特定 的 过 程 ， 而 被 调用 过 程 的 名 字 在 此 次 调用 
中 明确 给 出 , 那么 处 理 方法 就 很 简单 。 更 复杂 的 情况 是 当 调 用 的 对 象 是 一 个 过 程 型 参数 的 时 候 。 
在 那 种 情况 下 , 要 在 运行 时 刻 才 能 知道 被 调用 的 是 哪个 过 程 ， 因 此 在 这 个 调用 的 不 同 执行 中 , 被 
调用 过 程 的 诬 套 深度 可 能 有 所 不 同 。 因 此 , 让 我 们 首先 考虑 当 一 个 过 程 9 显 式 地 调用 过 程 p 时 会 
发 生 什么 事情 。 有 三 种 情况 : 

1) 过 程 p 的 府 套 深度 大 于 4 HIRERE, 那么 p 一 定 是 直接 在 g 中 定义 的 , 否则 g 调用 p 的 
位 置 就 不 可 能 位 于 过 程 名 p 的 作用 域内 。 因 此 , p 的 嵌 套 深度 恰好 比 4 的 嵌 套 深度 大 1, m p 的 访 
问 链 一 定 指 向 9。 这 个 问题 很 简单 ， 只 需要 在 调用 代码 序列 中 增加 一 个 步骤 , 即 在 p 的 访问 链 中 
放置 一 个 指向 g 的 活动 记录 的 指针 。 这 样 的 例子 包括 sort 对 quicksort 的 调用 ,该 调用 生成 了 








图 7-11a; 以 及 quicksort 对 partition 的 调用 , 该 调用 产生 了 图 7-11c。 

2) 这 个 调用 是 递归 的 , 也 就 是 说 P=99 。 那么 , 新 的 活动 记录 的 访问 链 和 它 下 面 的 活动 记录 
的 访问 链 是 相同 的 。 例 如 quicksort(1, 9) 对 quicksort(1, 3) 的 调用 , 该 调用 形成 了 图 7-11b。 

3) p RERE n, 小 于 9 的 柑 套 深度 ns。 为 了 使 g 中 的 调用 位 于 名 字 的 作用 域 中 , 过 程 4 
必定 嵌 套 在 某 个 过 程 > 中 , 而 是 一 个 直接 在 r 中 定义 的 过 程 。 因 此 , Mog 的 活动 记录 开始 , 沿 着 


访问 链 经 过 mw -n, +1 步 就 可 以 找到 栈 中 最 高 的 7 的 活动 记录 。 那 么 , p 的 访问 链 必 须 指向 r 的 
这 个 活动 记录 。 





AU EREL 的 一 个 例子 , 请 注意 我 们 是 如 何 从 图 7-11e 转变 为 图 7-11d 的 。 被 调用 函数 
exchange 的 嵌 套 深度 为 2， 比 调用 函数 partition 的 舱 套 深度 3 少 1。 因 此 , 我 们 从 partition 的 活动 
记录 开始 , 前 进 3 -2+1 =2 个 访问 链 , 这 使 我 们 从 partition 的 活动 记录 到 达 quicksort (1, 3 ) 的 活 
动 记录 , 再 到 sort 的 活动 记录 。 因 此 , exchange 的 访问 链 指向 sort 的 这 个 活动 记录 , 这 就 是 我 们 在 
图 7-11d 中 看 到 的 。 

另 一 种 等 价 的 找到 这 个 访问 链 的 方法 是 沿 着 访问 链 前 进 mw — n, 步 , 并 拷贝 在 那个 活动 记录 
中 找到 的 访问 链 。 在 我 们 的 例子 中 , 我 们 将 经 过 一 步 到 达 quicksore(1, 3) ROWE SHG, IE UL 
它 的 指向 sort 的 访问 链 。 请 注意 ， 这 个 访问 链 对 于 exchange 来 说 是 正确 的 ， 尽管 exchange 不 在 
quicksort 的 作用 域 中 , 这 两 个 函数 是 赃 套 在 sort 中 的 兄弟 函数 。 口 
7.3.7 过程 型 参数 的 访问 链 

当 一 个 过 程 p 作为 参数 传递 给 男 一 个 过 程 g, 并 且 g 随后 调用 了 这 个 参数 (因此 也 就 在 g 的 这 
个 活动 中 调用 了 p) ， 有 可 能 g 并 不 知道 p 在 程序 中 出 现时 的 上 下 文 。 如 果 是 这 样 ,4 就 不 可 能 知 
道 如 何 为 p 设 定 访问 链 。 这 个 问题 的 解决 办 法 如 下 : 当 过 程 被 用 作 参 数 的 时 候 , 调用 者 除了 传递 
过 程 参 数 的 名 字 , 同时 还 需要 传递 这 个 参数 对 应 的 正确 的 访问 链 。 

调用 者 总 是 知道 这 个 访问 链 ,因为 如 果 被 过 程 r 当 作 一 个 实在 参数 传递 , 那么 p 必然 是 一 
“个 可 以 被 访问 的 名 字 。 因 此 ,+ 可 以 像 直接 调用 p 那样 为 p 确定 访问 链 。 也 就 是 说 , 我 们 使 用 
7.3.6 节 中 给 出 的 有 关 构 造访 问 链 的 规则 。 








MEE 在 图 7-12 中 , 我 们 看 到 一 个 ML 函数 a 的 大 [tun acy = 
体 描述 。 函数 a PRETKA b 和 c。 函 数 “ME 
为 函数 的 参数 1, b 调用 了 这 个 参数 。 函 数 。 在 它 自身 中 oe Piela 
定义 了 一 个 函数 4， 然后 用 实在 参数 4 调用 了 bo 

让 我 们 分 析 一 下 在 执行 a 的 时 候 发 生 了 什么 事情 。 fun d(z) = ... 
首先 , a 调用。, 因此 我 们 在 栈 中 将 。 的 活动 记录 放 在 ee 
的 活动 记录 之 上 。 因 为 c 是 直接 在 a 中 定义 的 , 所 以 * a 
的 访问 链 指向 a 的 记录 。 然 后 。 调用 8(d) 。 调 用 代码 ae oe 
序列 设置 了 4 的 活动 记录 , 如 图 7-13a 所 示 。 








在 这 个 活动 记录 中 有 实在 参数 d 和 它 的 访问 链 , 两 
者 结合 组 成 了 5 的 活动 记录 中 的 形式 参数 /的 值 。 请 注 图 7-12 使 用 函数 参数 的 ML 程序 的 概要 
Bic 了解 4 的 信息 , 因为 a 是 在 c 中 定义 的 , 因而 ce 传递 了 -一 个 指向 它 自已 的 活动 记录 的 指针 作 
为 4 的 访问 链 。 不管 d 在 哪里 定义 , WR c 在 该 定义 的 作用 域内 , 那么 必然 适用 7. 3.6 节 中 的 三 





O ML 支持 相互 递归 调用 的 函数 , 这 种 情况 可 以 用 同样 的 方式 处 理 。 
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条 规则 之 一 , 因此 c 可 以 给 出 这 个 访问 链 。 
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b) 
图 7-13 带 有 它们 自己 的 访问 链 的 实在 参数 


现在 让 我 们 看 一 下 吗 数 5 所 做 的 工作 。 我 们 知道 它 将 在 某 个 点 上 使 用 它 的 参数 1， 其 效果 就 
是 调用 了 d。 如 图 7-13b ras, d 的 一 个 活动 记录 出 现在 栈 中 。 应 该 放 在 这 个 活动 记录 中 的 正确 
的 访问 链 可 以 在 参数 的 值 中 找到 ,该 访问 链 指 向 c 的 活动 记录 , 因为 就 在 的 定义 的 外 围 。 
请 注意 , 能 够 正确 地 设置 这 个 访问 链 , 尽管 5 不 在 c 的 定义 的 作用 域内 。 口 
7.3.8 显示 表 

使 用 访问 链 的 方法 来 访问 非 局 部 数据 的 问题 之 一 是 ， 如 果肉 套 深 度 变 大 , 我 们 就 必须 沿 着 一 
段 很 长 的 访问 链 路 才能 找到 需要 的 数据 。 一 个 更 高 效 的 实现 方法 是 使 用 一 个 称 为 显示 表 (dis- 
play ) 的 辅助 数组 d, 它 为 每 个 典 雁 深度 保存 了 一 个 指针 。 我 们 设法 使 得 在 任何 时 刻 , 指针 ali] 
向 栈 中 最 高 的 对 应 于 基 个 嵌 套 深度 为 在 的 过 程 的 活动 记录 。 图 7-14 给 出 了 一 个 显示 表 的 例子 。 
例如 ,在 图 7-14d 中 , 我 们 看 到 显示 表 d 的 元 素 df1] 保 存 了 一 个 指向 sort 的 活动 记录 的 指针 ,该 
活动 记录 是 最 高 的 (也 是 唯一 的 ) 对 应 于 某 个 典 套 深度 为 1 的 函数 的 活动 记录 。 同 时 , d[2] 保 存 
了 指向 exchange 的 活动 记录 的 指针 , 该 记录 是 柑 套 深度 为 2 的 最 高 活动 记录 。d[31 指 向 parti- 
tion, 即 垦 套 深度 为 3 的 最 高 活动 记录 。 

使 用 显示 表 的 优势 在 于 如 果 过 程 p 正在 运行 , 且 它 需 要 访问 属于 某 个 过 程 9 的 元 素 *, 那么 
我 们 只 需要 查看 di] MA, 其 中 , i 是 g ORERE, RIARTE d[ 让 找到 9 的 活动 记录 , 根 
据 已 知 的 偏 移 量 就 可 以 在 这 个 活动 记录 中 找到 x。 编译 器 知道 i 的 值 , 因此 它 可 以 产生 代码 , 该 
代码 根据 di) Al x 相对 于 9 的 活动 记录 顶部 的 偏 移 量 来 访问 x。 因 此 , 该 代码 不 需要 经 过 一 段 很 
长 的 访问 链 路 。 

为 了 正确 地 维护 显示 表 , 我 们 需要 在 新 的 活动 记录 中 保存 显示 表 条 目的 原来 的 值 。 如 果 茸 
套 深 度 为 n, 的 过 程 p 被 调用 , 并 且 它 的 活动 记录 不 是 栈 中 的 对 应 于 某 个 深度 为 w 的 过 程 的 第 一 
个 活动 记录 , 那么 p 的 活动 记录 就 需要 保存 d[n] 原 来 的 值 , 同时 d[ mw | 本身 则 被 设 定 指向 p 的 





这 个 活动 记录 。 当 bp 返回 且 它 的 这 个 活动 记录 从 栈 中 清除 时 , 我 们 将 dL nj | 恢复 到 对 p 的 这 次 调 
用 之 前 的 值 。 


图 7-14 给 出 了 操作 显示 表 的 若干 步骤 。 在 图 7-14a 中 , 深度 为 1 的 sort 调用 了 深度 为 2 
的 quicksort(1, 9), quicksort 的 活动 记录 中 有 一 个 用 于 存放 d[ 2] 的 原 值 的 位 置 , 图 中 显示 为 “ 保 
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# d[2]”, 尽管 在 这 个 例子 中 因为 之 前 没有 深度 为 2 的 活动 记录 , 这 个 指针 为 空 。 
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图 7-14 维护 显示 表 


在 图 7-14b 中 ， quicksort(1, 9) 调 用 quicksort(1, 3) 。 因 为 这 两 次 调用 的 活动 记录 的 深度 都 为 
2, 所 以 我 们 必须 首先 将 d[ 2] 中 指向 quicksort (1, 9) 的 指针 保存 到 quicksort(1, 3) 的 活动 记录 中 
去 。 然 后 d[2] 被 设置 为 指向 quicksot(1, 3). 

下 一 步调 用 partition。 这 个 函数 的 垦 辱 深度 为 3， 因此 我 们 将 首次 使 用 显示 表 中 的 d[3] 位 
置 , 并 使 它 指 向 partition 的 活动 记录 。partition 的 记录 中 有 一 个 存放 原来 的 d[3] 值 的 位 置 。 但 是 
在 这 个 例子 中 , dt3] 原 先 没 有 值 ， 因 此 这 个 位 置 上 的 指针 为 空 。 此 时 的 显示 表 和 栈 如 图 7-14c 
所 示 。 

然后 ，partition 调用 exchange, PAX exchange MAREN 2, 因此 它 的 活动 记录 保存 了 旧 的 - 

d[2] 指 针 , 即 指向 quicksori(1, 3) 的 活动 记录 的 指针 。 请 注意 , 这 里 总 现 了 多 个 显示 表 指 针 之 间 

相互 交叉 的 情况 。 也 就 是 说 , d[3] 指 向 的 位 置 比 d[2] 所 指 位 置 更 低 。 这 是 一 个 正常 的 情况 , A 
为 exchange 只 访问 它 自 己 的 数据 和 通过 d[ 1] 访 问 的 sort 的 数据 。 Ej 
7.3.9 7.3 节 的 练习 

练习 7. 3.1: 图 7-15 中 给 出 了 一 个 按照 非 标准 方式 计算 Fibonacci 数 的 ML 语言 的 函数 
main, PAX fib0 将 计算 第 个 Fibonacci 数 (n 宇 0)。 嵌 套 在 fibo 中 的 是 fibi, 它 假设 nz2 
并 计算 第 n 个 Fibonacci $o WEE fibl 中 的 是 fib2, 它 假设 n 宇 4。 请 注意 , fibi 和 fib2 都 
不 需要 检查 基本 情况 。 我 们 考虑 从 对 main 的 调用 开始 , 直到 (对 fibo(1) 的 ) 第 一 次 调用 即将 
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返回 的 时 段 , 请 描述 出 当时 的 活动 记录 栈 , 并 给 出 栈 中 的 各 个 活动 记录 的 访问 链 。 
练习 7. 3.2: 假设 我 们 使 用 显示 表 来 实现 图 7-15 中 的 函数 。 请 给 出 对 fibo(I) 的 第 一 次 调 
用 即将 返回 时 的 显示 表 。 同 时 指明 那 时 在 栈 中 的 各 个 活动 记录 中 保存 的 显示 表 条 目 。 














fun main () { 
let 
fun fib0(n) = 
let 
fun fibi(n) = 
let 
fun fib2(n) = fibl(n-1) + fibi(n-2) 
in 





if n >= 4 then fib2(n) 
else fibO0(n-1) + fibO(n-2) 
end 
in 
if n >= 2 then fibi(n) 
else 1 
end 
in 
£ib0(4) 
end; 





图 7-15 计算 Fibonacci AMHR PRL 


7.4 PEE 


堆 是 存储 空间 的 一 部 分 , 它 被 用 来 存储 那些 生命 周期 不 确定 , 或 者 将 生存 到 被 程序 显 式 删除 
为 止 的 数据 。 虽 然 局 部 变量 通常 在 它们 所 属 的 过 程 结束 之 后 就 变 得 不 可 访问 , 但 很 多 语言 支持 
创建 某 种 对 象 或 其 他 数据 , 它们 的 存在 与 否 和 创建 它们 的 过 程 的 活动 无 关 。 例 如 ,，C ++ 和 Java 
语言 都 为 程序 员 提 供 了 new 语句， 该 语句 创建 的 对 象 (或 指向 对 象 的 指针 ) 可 以 在 过 程 之 间 进 行 
传递 ,因此 这 些 对 和 象 在 创建 它们 的 过 程 结束 之 后 仍然 可 以 长 期 存在 。 这 样 的 对 象 被 存放 在 堆 区 。 

在 本 节 中 , 我 们 将 讨论 存储 管理 器 (memory manager) ， 即 分 配 和 回收 堆 区 空间 的 子 系统 ， 它 
是 应 用 程序 和 操作 系统 之 间 的 一 个 接口 。 对 于 C 或 C++ 这 样 需要 手动 回收 存储 块 的 语言 ( 即 通 
过 程序 中 的 显 式 语句 ， 比 如 tree R delete, 进行 回收 ) MA, 存储 管理 器 还 负责 实现 空间 
回收 。 

我 们 将 在 7. 5 节 中 讨论 垃圾 回收 (garbage collection) , 即 在 堆 区 中 找到 那些 不 再 被 程序 使 用 、 
因此 可 以 被 重新 分 配 以 便 存放 其 他 数据 项 的 空间 的 过 程 。 对 于 Java 这 样 的 语言 , 内存 的 回收 是 
由 垃圾 回收 融 完 成 的 。 在 需要 进行 垃圾 回收 时 , 垃圾 回收 器 是 存储 管理 器 的 一 个 重要 子 系统 。 
7.4.1 存储 管理 器 
存储 管理 器 总 是 跟踪 堆 区 中 的 空闲 空间 。 它 具有 两 个 基本 的 功能 : 

e 分 配 。 当 程序 为 一 个 变量 或 对 象 请 求 内 存 时 含 , 存储 管理 器 产生 一 段 连 续 的 具有 被 请 求 

大 小 的 堆 空间 。 如 果 有 可 能 , 它 使 用 堆 中 的 空闲 空间 来 满足 分 配 请 求 ; 如 果 没 有 被 请 求 
大 小 的 空间 块 可 供 分 配 , 它 试图 从 操作 系统 中 获得 连续 的 虚拟 内 存 来 增加 堆 区 的 存储 空 








O 在 后 面 的 内 容 中 , 我 们 将 把 需要 内 存 空间 的 事物 称 为 “对 象 ”"， 尽管 它们 并 不 是 “面向 对 象 程序 设计 "意义 上 的 得 
正 对 象 。 
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闻 。 姐 果 空 间 已 经 用 完 , 存储 管理 器 将 空间 耗 尽 的 信息 传 回 给 应 用 程序 。 

e 回收 。 存 储 管理 器 把 被 回收 的 空间 返还 到 空闲 空间 的 缓冲 池 中 , 这 样 它 可 以 复 用 该 空间 
来 满足 其 他 的 分 配 请 求 。 存 储 管 理 器 通常 不 会 将 内 存 返 回 给 操作 系统 , 即使 当 这 个 程序 
不 再 需要 那么 多 的 堆 空 间 时 也 不 会 归还 给 操作 系统 。 

如 果 下 面 的 (a) (b) 两 个 条 件 都 成 立 , 内 存 的 管理 就 会 相对 简单 ; (a) 所 有 分 配 请 求 都 要 求 
相同 大 小 的 存储 块 ,，(b) 存 储 空间 按照 可 预见 的 方式 被 释放 ， 比 如 先 分 配 先 回收 。 对 于 有 些 语言 
( 比如 Lisp) 而 言 条 件 a 成 立 。 纯 的 Lisp 语言 只 使 用 一 种 数据 元 素 一 个 双 指 针 单 元 ,所 有 的 
数据 结构 都 在 该 元 素 的 基础 上 构建 。 条 件 b 在 某 些 情况 下 也 可 能 成 立 ， 最 常 抑 的 情况 是 可 以 在 
运行 时 刻 栈 中 分 配 的 数据 。 然 而 , 对 于 大 部 分 的 语言 而 言 , 这 两 个 条 件 一 般 都 不 成 立 。 相 反 地 ， 
我 们 需要 为 不 同 大 小 的 数据 元 素 分 配 空间 , 并 且 没 有 好 方法 可 以 预测 所 有 已 分 配对 象 的 生命 期 。 

因此 , 存储 管理 器 必须 准备 以 任何 顺序 来 处 理 任何 大 小 的 空间 分 配 和 回收 请 求 。 这 些 请 求 
小 到 一 个 字 节 , 大 到 该 程序 的 整个 地 址 空间 。 

下 面 是 我 们 期 望 存储 管理 器 具有 的 特性 : 

e 空间 效率 。 存 储 管理 器 应 该 能 够 使 一 个 程序 所 需 的 推 区 空间 的 总 量 达 到 最 小 。 这 样 做 就 





到 最 少 而 得 到 的 ,该 技术 将 在 7.4.4 节 中 讨论 。 
程序 效率 。 存 储 管理 器 应 该 充分 利用 存储 子 系统 , 使 程序 可 以 运行 得 更 快 。 我 们 将 在 
7. 4. 2 节 中 看 到 , 根据 数据 对 象 在 存储 中 所 处 的 不 同位 置 , 执行 一 条 指令 所 花费 的 时 间 可 
能 相差 很 大 。 幸 运 的 是 , 程序 通常 会 表现 出 “局 部 性 ”, 7. 4. 3 节 将 讨论 这 种 现象 , 它 指 的 
是 通常 的 程序 在 访问 内 存 时 具有 的 非 随机 性 聚集 的 特性 。 通 过 关注 对 象 在 存储 中 的 放置 
方法 , 存储 管理 器 可 以 更 好 地 利用 空间 , 并且 有 希望 使 程序 运行 得 更 快 。 
低 开 销 。 因 为 存储 分 配 和 回收 在 很 多 程序 中 是 常用 的 操作 ,因此 使 得 这 些 操作 尽 可 能 地 
高 效 是 非常 重要 的 。 也 就 是 说 , 我 们 希望 最 小 化 开销 (overhead) , 即 花费 在 分 配 和 回收 上 
的 执行 时 间 在 总 运行 时 间 中 所 占 的 比例 。 请 注意 , 分 配 的 开销 由 小 型 请 求 决定 , 管理 大 
型 对 象 的 开销 相对 不 重要 ,因为 通常 会 在 它 上 面 执行 大 量 的 计算 , 这 个 开销 被 分 扒 了 。 
7.4.2 一 台 计算 机 的 存储 层次 结构 

存储 管理 和 编译 器 优化 必须 在 充分 了 解 存储 行为 的 基础 上 完成 。 现 代 机 器 的 设计 使 得 程序 
员 不 需要 考虑 内 存 子 系统 的 细节 就 能 够 写 出 正确 的 程序 。 然 而 , 程序 的 效率 不 仅 取决 于 被 执行 
的 指令 的 数量 ,还 取决 于 执行 其 中 每 条 指令 所 花费 的 时 间 。 不 同情 况 下 执行 一 条 指令 所 花费 的 时 
间 可 能 会 有 明显 的 不 同 , 因为 访问 不 同 的 存储 区 域 所 花费 的 时 间 从 几 纳 秒 到 几 毫 秒 不 等 。 因 此 ， 
数据 密集 型 程序 可 以 从 能 够 充分 利用 存储 子 系统 的 优化 技术 中 得 到 很 大 的 好 处 。 我 们 将 在 7.4.3 
节 看 到 , 这 种 优化 可 以 利用 程序 的 “局 部 性 "现象 , 即 一 般 程 序 的 非 随 机 行为 。 a 

内 存 访问 时 间 上 的 巨大 差异 源 于 硬件 技术 的 根本 性 局 限 。 我 们 可 以 制造 出 一 个 小 而 快 的 存 
储 器 件 或 者 大 而 慢 的 存储 器 件 , 但 是 无 法 制造 出 既 大 又 快 的 存储 器 件 。 现 在 ， 制 造 一 个 具有 纳 秒 
级 访问 时 间 的 千 兆 容量 的 存储 器 件 仍 然 是 不 可 能 的 ， 而 纳 秒 级 正 是 高 性 能 处 理 器 的 运行 速度 。 
因此 , 在 实践 中 , 现代 计算 机 都 以 存储 层次 结构 (memory hierarchy) 的 方式 安排 它们 的 存储 。 如 图 ， 
7-16 所 示 的 一 个 存储 层次 结构 由 一 系列 存储 元 素 组 成 ， 较 小 较 快 的 元 素 “ 更 加 接近 "处理 器 , 较 
大 但 较 慢 的 元 素 则 离 存储 器 比较 远 。 

一 个 处 理 器 通常 具有 少量 寄存 器 , STEREO AA ECS i. RE, 它 具有 一 层 或 多 层 高 
速 缓存 , 这 些 高 速 缓存 通常 使 用 静态 RAM 制造 ， 其 大 小 从 几 千 字 节 到 几 兆 字 节 不 等 。 层 次 结构 
中 的 下 一 层 是 物理 ( 主 ) 内 存 , 它 由 数 百 兆 到 几 千 兆 的 动态 RAM 构成 。 物 理 内 存 由 下 一 层 的 虚拟 
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内 存 提供 支持 , 虚拟 内 存 由 几 千 兆 字 节 的 磁盘 实现 。 在 一 次 内 存 访问 中 ,机 器 首先 在 最 近 ( 最 底 
层 的 ) 的 存储 中 寻找 数据 ， 如 果 数 据 不 在 那里 则 到 上 一 层 中 寻找 ,以 此 类 推 。 





























典型 的 大 小 典型 的 访问 时 间 
re Ree TA a : 
> 2GB HEAP (Beg) | 3 一 15 ms 
256MB ~2GB 物理 内 存 | 100 ~150 ns 
128KB ~-4MB 二 级 商 速 缓存 | 40~60 ns 
ote 加 wie 4 
16 ~ 64KB 一 级 高 速 缓存 | 5 一 10 ns 
5 eee J 
二 
32 个 机 器 字 寄存 器 (处 理 器 ) 1 us 











图 7-16 典型 的 内 存 层次 结构 的 配置 


寄存 器 个 数 很 少 , 因此 寄存 器 的 使 用 会 根据 特定 应 用 进行 裁剪 ， 并 由 编译 器 生成 的 代码 进行 
管理 。 存 储 层次 结构 中 的 所 有 其 他 层 都 是 自动 管理 的 。 这 样 做 不 仅 简化 了 编程 任务 ,并 且 相 同 
的 程序 可 以 在 具有 不 同 存储 配置 的 机 器 上 高 效 工作 。 对 于 每 次 存储 访问 , 机 器 从 最 低层 开始 逐 
层 搜索 每 一 层 存储 ,直到 找到 数据 为 止 。 高 速 缓存 是 完全 通过 硬件 进行 管理 的 , 这 么 做 是 为 了 能 
够 跟 上 相对 较 快 的 RAM 访问 时 间 。 因 为 磁盘 访问 速度 相对 较 慢 , 虚拟 内 存 是 由 操作 系统 进行 管 
理 的 , 辅 以 一 个 称 为 “转换 旁 视 缓冲 ”的 硬件 结构 。 

数据 以 连续 存储 块 的 方式 进行 传输 。 为 了 分 挫 访 问 的 开销 ， 内 存 层次 结构 中 较 慢 的 层次 通 
常 使 用 较 大 的 块 。 在 主 存 和 高 速 缓存 之 间 的 数据 是 按照 被 称 为 高 速 缓存 线 (cache line) 的 块 进行 
传输 的 ,高 速 缓存 线 的 长 度 通 常 在 32 ~ 256 字 节 之 间 。 在 虚拟 内 存 ( 硬 盘 ) 和 主 内存 之 间 的 数据 
是 以 被 称 为 “页 ”( page) 的 内 存 块 进行 传输 的 , 页 的 大 小 通常 在 4~64 KB 之 间 。 
7.4.3 程序 中 的 局 部 性 

大 部 分 程序 表现 出 高 度 的 局 部 性 (locality) , 也 就 是 说 , 程序 的 大 部 分 运行 时 间 兹 费 在 相对 较 
小 的 一 部 分 代码 中 , 此 时 它们 只 涉及 少 部 分 数据 。 如 果 一 个 程序 访问 的 存储 位 置 很 可 能 将 在 一 
个 很 短 的 时 间 段 内 被 再 次 访问 , 我们 就 说 这 个 程序 具有 时 间 局 部 性 (temporal locality) 。 如 果 被 访 
问 过 的 存储 位 置 的 临近 位 置 很 可 能 在 一 个 很 短 的 时 间 段 内 被 访问 , 我 们 就 说 这 个 程序 具有 空间 
局 部 性 (spatial locality) 。 

通常 认为 程序 把 90% 的 时 间 用 来 执行 10% 的 代码 。 原 因 如 下 : 

© 程序 经 常 包含 很 多 从 来 不 会 被 执行 的 指令 。 使 用 组 件 和 库 构 建 得 到 的 程序 只 使 用 了 它们 
提供 的 一 小 部 分 功能 。 同 时 , 随 着 需求 的 改变 和 程序 的 演化 ， 遗留 系统 中 常常 包含 很 多 
不 再 被 使 用 的 指令 。 
在 程序 的 一 次 典型 运行 中 , 可 能 被 调用 的 代码 中 只 有 一 小 部 分 会 被 实际 执行 。 例 如 , R 
然 处 理 非法 输入 和 异常 情况 的 指令 对 于 程序 的 正确 性 是 至 关 重 要 的 ， 但 是 它们 在 某 次 运 
行 中 很 少 会 被 调用 。 
o 通常 的 程序 往往 将 大 部 分 时 间 花 费 在 执行 程序 中 的 最 内 层 循环 和 最 紧凑 的 递归 环 上 。 
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静态 的 和 动态 的 RAM 

大 部 分 随机 访问 内 存 是 动态 的 (dynamic), 这 意味 着 它们 是 由 简单 的 电子 电路 构成 的 。 

这 些 电路 会 在 短 时间 内 丢失 电位 (因此 也 就 会 “忘记 "它们 原本 存储 的 比特 值 )。 这 些 电 路 需 

要 定期 刷新 ， 即 读 出 然后 重新 写 入 它们 的 比特 。 男 一 方面 , 在 静态 ( static ) RAM 的 设计 中 , 每 

个 比特 都 需要 一 个 更 复杂 的 电路 , 结果 是 存储 在 其 中 的 比特 值 可 以 保持 任意 长 时 间 ， 直到 它 

被 改写 为 止 。 显 然 , 一 个 芯片 使 用 动态 RAM 电路 可 以 比 使 用 静态 RAM 电路 存储 更 多 的 比 

特 。 因 此 我 们 通常 会 看 到 动态 RAM 类 型 的 大 容量 主 存 , 而 像 高 速 缓存 这 样 的 较 小 存储 则 使 
用 静态 电路 构造 。 














局 部 性 使 得 我 们 可 以 充分 利用 如 图 7-16 所 示 的 现代 计算 机 的 存储 层次 结构 。 将 最 常用 的 指 
令 和 数据 放 在 快 而 小 的 存储 中 , 而 将 其 余部 分 放 人 慢 而 大 的 存储 中 , 我 们 就 可 以 显著 地 降低 一 个 
程序 的 平均 存储 访问 时 间 。 

人 们 已 经 发 现 , 很 多 程序 在 对 指令 和 数据 的 访问 方式 上 既 表 现 出 时 间 局 部 性 ,又 表现 出 空间 
局 部 性 。 然 而 , 数据 访问 模式 通常 比 指令 访问 模式 表现 出 更 大 的 多 样 性 。 将 最 近 使 用 的 数据 放 
在 最 快 的 存储 层次 中 的 策略 可 以 在 普通 程序 中 发 挥 很 好 的 作用 , 但 是 在 某 些 数据 密集 型 程序 中 
的 作用 并 不 明显 一 一 循环 遍历 非常 大 的 数组 的 程序 就 是 这 样 的 例子 

仅仅 通过 查看 代码 , 我 们 一 般 无 法 看 出 哪 部 分 代码 会 被 频繁 地 用 到 , 针对 特定 输入 指出 这 一 
点 则 更 加 困难 。 即 使 我 们 知道 哪些 指令 会 被 频繁 执行 , 最 快 的 高 速 缓存 通常 也 不 能 够 同时 存储 
这 些 指 令 。 因 此 , 我 们 必须 动态 调整 最 快 的 存储 中 的 内 容 , 用 它们 来 保存 可 能 很 快 会 被 频繁 使 用 
的 指令 。 

利用 存储 层次 结构 的 优化 

将 最 近 使 用 过 的 指令 放 入 高速 缓 存 的 策略 通常 很 有 效 。 换 名 话说 , 过 去 的 情况 能 够 很 好 地 
预测 将 来 的 存储 使 用 情况 。 当 一 条 新 的 指令 被 执行 时 ,其 下 一 条 指令 也 很 有 可 能 将 被 执行 。 这 
种 现象 是 空间 局 部 性 的 一 个 例子 。 提 高 指令 的 空间 局 部 性 的 一 个 有 效 技术 是 让 编译 器 把 很 可 能 
连续 执行 的 多 个 基本 块 ( 即 总 是 顺序 执行 的 指令 序列 ) 连 续 存 放 , 即 放 在 同一 个 存储 页 面 中 , 可 
能 的 话 甚至 放 在 同一 高 速 缓存 线 中 。 属 于 同一 个 循环 或 同一 个 函数 的 指令 很 有 可 能 被 一 起 
运行 9 。 

我 们 还 可 以 改变 数据 布局 或 计算 顺序 , 从 而 改进 一 个 程序 中 的 数据 访问 的 时 间 局 部 性 和 空间 局 
部 性 。 例 如 , 一 些 程序 反复 地 访问 大 量 数据 , 而 每 次 访问 只 完成 少量 的 计算 , 这 样 的 程序 的 性 能 不 
会 很 好 。 我 们 可 以 每 次 将 一 部 分 数据 从 存储 层次 结构 的 较 慢 层次 加 载 到 较 快 层 次 (比如 从 磁盘 移 到 
主 存 ), 并 且 在 这 些 数据 驻 留 在 较 快 层 中 时 执行 所 有 针对 这 些 数 据 的 运算 , 那么 程序 的 性 能 就 会 变 
得 更 好 。 这 个 概念 可 以 递归 地 应 用 于 物理 内 存 、 高 速 缓 存 以 及 寄存 器 中 的 数据 的 复 用 。 





高 速 缓存 体系 结构 
我 们 如 何 知道 一 个 高 速 缓存 线 在 高 速 缓存 中 呢 9 逐个 检查 高 速 缓存 中 的 每 一 条 高 速 缓存 
线 过 于 费时 ， 因此 在 实 路 中 常常 常会 限制 一 条 高 速 缓存 线 在 高 速 缓存 中 的 放 年 位 置 。 这 个 约束 








加“ 当 机 器 从 内 存 中 获得 一 个 存储 字 时 , 同时 预 取 ( prefetch) 出 其 后 的 多 个 连续 内 存 字 的 开销 相对 较 小 。 因 此 , 一 个 
常见 的 存储 层次 结构 的 特性 是 在 每 次 访问 某 层 存 储 的 时 候 会 从 该 层 存储 中 获取 一 个 包含 了 多 个 机 器 字 的 块 。 
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称 为 成 组 相关 性 (set associativity) 。 如 果 在 一 个 高 速 缓存 中 ， -条 缓存 线 只 能 被 放 在 上 个 位 置 
E, 那么 这 个 高 速 缓存 就 称 为 天 路 成 组 相关 的 (k-way set associative ) 。 最 简单 的 高 速 缓存 是 1 
路 相关 高 速 缓存 ， 它 也 称 为 直接 映射 高 速 缓存 (direct-mapped cache) 。 在 一 个 直接 映射 高 速 绥 
存 中 ,存储 地 址 为 的 数据 只 能 够 放 在 缓存 地 址 ”mod s 上 , 其 中 * 是 这 个 高 速 缓存 的 大 小 。 
类 似 地 ,一 个 大 路 成 组 相关 高 速 缓存 被 分 为 下 个 集合 ， 而 一 个 地 址 为 款 的 数据 只 能 映射 到 各 
个 集合 中 的 位 置 n mod (s/k) 上 。 大 部 分 指令 和 数据 高 速 缓存 的 相关 性 在 1 ~8 之 间 。 如 果 一 
条 缓存 线 被 调 人 高 速 缓存 , 并 且 所 有 可 能 存放 这 个 高 速 缓存 线 的 位 置 都 已 经 被 占用 , 那么 通 
常情 况 下 会 将 最 近 最 少 使 用 的 缓存 线 清 除 出 高 速 缓存 。 














7.4.4 ”碎片 整理 

在 程序 开始 执行 的 时 候 , 堆 区 就 是 一 个 连续 的 空闲 空间 单元 。 随 着 这 个 程序 分 配 和 回收 存 
储 工作 的 进行 , 空间 被 分 割 成 若干 空 闪 存储 块 和 已 用 存储 块 ， 而 空闲 块 不 一 定位 于 堆 区 的 某 个 连 
续 区 域 中 。 我 们 将 空闲 存储 块 称 为 “窗口 ”(hole) 。 对 于 每 个 分 配 请 求 , 存储 管理 器 必须 将 请 求 
的 存储 块 放 入 一 个 足够 大 的 “窗口 "中 。 除 非 找到 一 个 大 小 恰好 相等 的 “窗口 ", 否则 我 们 必定 会 
DPR AA, 结果 创建 出 更 小 的 窗口 。 i 

对 于 每 个 回收 请 求 , 被 释放 的 存储 块 被 放 回 到 空闲 空间 的 缓冲 池 中 。 我 们 把 连续 的 窗口 接 
合 (coalesce) 成 为 更 大 的 窗口 ,否则 窗口 只 会 越 变 越 小 。 如 果 我 们 不 小 心 , 空闲 存储 最 终 会 变 成 
碎片 ,， 即 大 量 的 细小 日 不 连续 的 窗口 。 此 时 , 就 有 可 能 找 不 到 一 个 足够 大 的 “窗口 "来 满足 某 个 
将 来 的 请 求 , 尽管 总 的 空闲 空间 可 能 仍然 充足 。 

best-fit 和 next-fit 对 象 放 置 

我 们 通过 控制 存储 管理 器 在 堆 区 中 放置 新 对 象 的 方法 来 减少 碎片 。 经 验 表明 , 使 现实 中 的 
程序 中 碎片 最 少 的 一 个 良好 策略 是 将 请 求 的 存储 分 配 在 满足 请 求 的 最 小 可 用 窗口 中 。 这 个 best- 
fit 算法 趋向 于 将 大 的 窗口 保留 下 来 满足 后 续 的 更 大 请 求 。 另 一 种 策略 被 称 为 first-fit。 在 这 个 策 
REP, 对象 被 放置 到 第 一 个 ( 即 地 址 最 低 的 ) 能 够 容纳 请 求 对 象 的 窗口 中 。 这 种 策略 在 放置 对 象 
时 花费 的 时 间 较 少 , 但 是 人 们 发 现 它 在 总 体 性 能 上 要 比 best-fit 策略 差 。 

为 了 更 有 效 地 实现 best-fit 放置 策略 , 我 们 可 以 根据 空闲 空间 块 的 大 小 , 将 它们 分 在 若干 个 
容器 中 。 一 个 实际 可 行 的 想法 是 为 较 小 的 尺寸 设置 较 多 的 容器 ,因为 小 对 象 的 个 数 通 常 比较 多 。 
例如 , E GNU 的 C 编译 器 geo 中 使 用 的 存储 管理 器 Lea 将 所 有 的 存储 块 对 齐 到 8 字 节 的 边界 。 对 
于 16 字 节 到 512 字 节 之 间 的 、 每 个 大 小 为 8 字 节 整数 倍 的 存储 块 , 这 个 存储 管理 器 都 设置 了 一 
个 容器 。 更 大 尺寸 的 容器 按照 对 数值 进行 划分 ( 即 每 个 容器 的 最 小 尺寸 是 前 一 个 容器 的 最 小 尺寸 
的 两 倍 ) 。 在 每 一 个 容器 中 , 存储 块 按 照 它们 的 大 小 排列 。 总 是 存在 这 样 一 个 空闲 空间 块 , 存储 
管理 器 可 以 向 操作 系统 请 求 更 多 的 页 面 来 扩展 这 个 块 。 这 个 块 被 称 为 “荒野 块 ”( wilderness 
chunk) 。 因 为 它 的 可 扩展 性 ，Lea 把 这 个 块 当 作 最 大 尺寸 存储 块 的 容器 。 

容器 机 制 使 得 寻找 best-fit 块 变 得 容易 。 

e 如 果 被 请 求 的 尺寸 有 一 个 专 有 容器 ， 即 该 容器 只 包含 该 尺寸 的 存储 块 , 我 们 可 以 从 该 容 

器 中 任意 取出 一 个 存储 块 。Lea 存储 管理 器 在 处 理 小 尺寸 请 求 时 就 是 这 样 做 的 。 

e 如 果 被 请 求 的 尺寸 没有 专 有 的 容器 , 我 们 可 以 找 出 一 个 能 够 包含 该 尺寸 的 存储 块 的 容器 。 
在 这 个 容器 中 , 我 们 可 以 使 用 first-fit 或 best-fit 策略 。 也 就 是 说 , 我 们 既 可 以 找到 并 选择 
第 一 个 足够 大 的 存储 块 ， 也 可 以 花 更 多 的 时 间 去 寻找 最 小 的 满足 需求 的 存储 块 。 注 意 ， 
如 果 选 择 的 空闲 存储 块 的 大 小 不 是 正好 合适 , 通常 将 该 块 的 剩余 部 分 放 到 一 个 对 应 于 更 
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小 尺寸 的 容器 中 。 

© 不 过 , 这 个 目标 容器 可 能 为 空 , 或 者 这 个 容器 中 的 所 有 存储 块 都 太 小 , 不 能 满足 空间 请 
求 。 在 这 种 情况 下 , 我 们 只 需要 使 用 对 应 于 下 一 个 较 大 尺寸 的 容器 重新 进行 搜索 。 最 后 ， 
我 们 要 么 找到 可 以 使 用 的 存储 块 ， 要 么 到 达 ”“ 匾 野 块 ” 。 从 这 个 荒野 块 中 我 们 一 定 可 以 得 
到 需要 的 空间 , 但 有 可 能 需要 请 求 操作 系统 为 堆 区 增加 更 多 的 内 存 页 。 

虽然 best-fit 放置 策略 可 以 提高 空间 利用 率 , 但 从 空间 局 部 性 的 角度 考虑 ， 它 可 能 并 不 是 最 
好 的 。 程 序 在 同一 时 间 分 配 的 块 通常 只有 类 似 的 访问 模式 ,并 具有 类 似 的 生命 周期 。 因 此 将 它 
们 放置 在 一 起 可 以 改善 程序 的 空间 局 部 性 。 对 best-fit 算法 的 有 用 改进 之 一 是 在 找 不 到 恰巧 等 于 
请 求 尺寸 的 存储 块 时 , 使 用 另 一 种 对 象 放置 方法 。 在 这 种 情况 下 , 我 们 使 用 next-f Heme, 只 要 刚 
刚 分 割 过 的 存储 块 中 还 有 足够 的 空间 来 容纳 这 个 对 象 , 我 们 就 把 这 个 对 象 放置 在 这 个 存储 块 中 。 
next-fit 策略 还 可 以 提高 分 配 操作 的 速度 。 

管理 和 接合 空闲 空间 

当 一 个 对 象 通过 手工 方式 回收 时 ,存储 管理 器 必须 将 该 存储 块 设置 为 空闲 的 ,以便 它 可 以 被 
再 次 分 配 。 在 某 些 情况 下 , 还 可 以 将 这 个 块 和 扒 中 的 相 邻 块 含 并 (接合 ) 起 来 ,构成 一 个 更 大 的 
块 。 这 样 做 是 有 好 处 的 。 因 为 我 们 总 能 够 用 一 个 大 的 存储 块 来 完成 总 量 相等 的 多 个 小 存储 块 所 
完成 的 工作 , 但 是 不 能 用 很 多 个 小 存储 块 来 保存 一 个 大 对 象 , 而 合并 后 的 存储 块 就 有 可 能 做 到 。 

如 果 我 们 为 所 有 具有 国定 尺寸 的 存储 块 保留 一 个 容器 ,如 Lea 中 为 小 尺寸 块 所 做 的 那样 , 那 
么 我 们 可 能 倾向 于 不 把 相 邻 的 该 尺寸 的 块 合并 成 为 双 倍 大 小 的 块 。 比 较 简 单 的 做 法 是 将 所 有 同 
样 大 小 的 块 全 部 按照 需要 放 在 多 个 页 中 ,而 不 必 接 合 。 那 么 , 一 个 简单 的 分 配 / 回 收 方案 是 维护 
一 个 位 映射 , 其 中 的 每 个 比特 对 应 于 容器 中 的 一 个 块 。1 代表 该 块 已 被 占用 , 0 表示 它 是 空闲 的 。 
当 一 个 块 被 回收 时 , 我 们 将 它 对 应 的 1 改 为 0。 当 我 们 需要 分 配 一 个 存储 块 时 , 便 找 出 任意 一 个 
相应 比特 为 0 的 块 , 将 这 个 位 改 为 1, 然后 就 可 以 使 用 该 内 存 块 了 。 如 果 没 有 空闲 块 , 我 们 就 获 
取 一 个 新 的 页 , 将 其 分 割 成 适当 大 小 的 存储 块 , 同时 扩展 用 于 存储 管理 的 位 向 量 。 

在 有 些 情况 下 问题 会 变 得 比较 复杂 。 比 如 , 我 们 不 使 用 容器 而 把 堆 区 作为 一 个 整体 进行 管 
理 ; 或 者 我 们 想 要 接合 相 邻 的 块 , 并 在 必要 的 时 候 将 合并 得 到 的 块 移动 到 另 一 个 容器 中 。 有 两 种 
数据 结构 可 以 用 于 支持 相 邻 空闲 块 的 接合 : 

。 边界 标记 。 在 每 个 (不 管 是 空闲 的 还 是 已 分 配 的 ) 存储 块 的 高 低 两 端 , 我 们 都 存放 了 重要 
的 信息 。 在 块 的 两 端 都 设置 了 一 个 free/used 位 ,用 来 标识 当前 该 块 是 已 用 的 (used) 还 是 
空闲 的 (free) 。 在 与 每 一 个 free/used 位 相 邻 的 位 置 上 存放 了 该 块 中 的 字 节 总 数 。 

一 个 双重 链接 的 、 谈 入 式 的 空闲 列表 。 各 个 空闲 块 (而 不 是 已 分 配 的 块 ) 还 使 用 一 个 双重 
链表 进行 链接 。 这 个 链表 的 指针 就 存放 在 这 些 抉 中 ， 比 如 说 存放 在 紧 挨 着 某 一 端 边 界 标 
记 的 位 置 上 。 因 此 , 不 需要 额外 的 空间 来 存放 这 个 空闲 块 列表 , 尽管 它 的 存在 为 块 的 大 
小 设置 了 一 个 下 界 。 即 使 数据 对 象 只 有 一 个 字 节 , 存储 块 也 必须 提供 存放 两 个 边界 标记 
和 两 个 指针 的 空间 。 空 闲 列表 中 的 存储 块 的 顺序 没有 确定 。 例 如 ,这 个 列表 可 以 按 块 的 
大 小 排序 ,因此 可 以 支持 best-fit 放置 策略 。 

EO) 图 7-17 给 出 堆 区 的 一 个 部 分 , 其 中 包含 三 个 相 邻 的 存储 块 A、B 和 C。B 块 的 大 小 为 
100, 它 刚刚 被 回收 并 回 到 了 空闲 列表 中 。 因 为 我 们 知道 B 的 开始 位 置 ( 左 端 ) , 也 就 知道 了 紧 青 
在 B 的 左边 的 存储 块 的 末端 , 在 这 个 例子 中 就 是 A。A 右 端 的 free/used 位 当前 为 0, 因此 A 也 是 
空闲 的 。 于 是 我 们 可 以 将 A 和 B 接合 成 一 个 300 字 节 的 存储 块 。 . 

有 可 能 出 现 这 样 的 情况 , 即 紧 靠 在 B 的 右 端 的 存储 块 C 也 是 空 闪 的 。 在 这 种 情况 下 , 我 们 可 
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WHE A, BAC 侈 部 合并 起 来 。 请 注意 ,如 果 我 们 总 是 尽 可 能 地 把 存储 块 接合 起 来 , 那么 就 不 会 
有 两 个 连续 的 空闲 块 。 因 此 我 们 总 是 只 需要 查看 与 正 被 回收 的 块 相 邻 的 两 个 块 。 存 当前 例子 中 ， 
我 们 按照 下 面 的 步 又 找到 C 的 开始 位 置 。 我 们 从 已 知 的 B 的 左 端 开始 , TE B 的 左边 界 标记 中 知 
道 B 块 的 总 字 节 数 为 100 字 节 。 根 据 这 个 信息 , 我 们 可 以 找到 B 的 右 端 和 紧 靠 在 B 右边 的 存储 
块 的 起 始 位 置 。 在 该 点 上 , 我 们 检查 C 的 free/used 位 , 发 现 其 值 为 1, 表明 C 正在 被 使 用 ,因此 
C 不 可 以 被 接合 。 
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图 7-17 堆 的 片段 和 一 个 双重 链接 的 空闲 列表 

因为 我 们 必须 接合 A 和 B, 所 以 需要 从 空闲 列表 中 期 除 它 们 中 的 一 个 。 空 闲 列 表 的 双重 链接 
结构 使 得 我 们 可 以 找到 A 和 B 中 的 前 驱 和 后 继 结 点 。 请 注意 , 不 应 该 假定 在 物理 上 相 邻 的 A 和 . 
B 在 空闲 列表 中 也 相 邻 。 知 道 了 A 和 B 在 空闲 列表 中 的 前 驱 和 后 继 的 存储 块 ， 就 可 以 操作 列表 
中 的 指针 并 将 A 和 B 替换 为 一 个 接合 后 的 存储 块 。 

如 果 自 动 垃 圾 回收 过 程 将 所 有 已 分 配 的 存储 块 移动 到 一 段 连续 的 存储 中 , 它 同 时 还 可 以 消 
除 所 有 的 碎片 。 在 7.6.4 节 中 将 更 详细 地 讨论 垃圾 回收 机 制 和 存储 管理 之 间 的 相互 影响 。 
7.4.5 人 工 回 收 请 求 

我 们 在 本 节 的 最 后 讨论 人 工 存储 管理 。 此 时 , 程序 员 必 须 像 在 C 和 C ++ 语言 中 那样 显 式 地 
安排 数据 的 回收 。 在 理想 情况 下 ,任何 不 会 再 被 访问 的 存储 都 应 该 删除 。 反 过 来 ,任何 可 能 还 会 
被 引用 的 空间 都 不 能 删除 。 遗 憾 的 是 , 这 两 个 性 质 都 很 难保 证 。 除 了 考虑 人 工 回收 的 困难 之 处 
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以 外 , 我 们 还 将 描述 一 些 被 程序 员 用 于 处 理 这 些 难 点 的 技术 。 
人 工 回收 带 来 的 问题 


人 工 存储 管理 很 容易 出 错 。 常 见 的 错误 有 两 种 形式 : 一 直 未 能 删除 不 能 被 引用 的 数据 , 这 称 
为 内 存 汇 漏 ( memory-leak ) 错误 34 | 用 已 经 被 删除 的 数据 这 称 为 悬空 指针 引用 ( dangling-pointer- 
dereference ) 错误 。 

程序 员 不 能 保证 一 个 程序 是 否 永远 不 会 在 将 来 引用 菜 块 存储 , 因此 第 一 个 常见 的 错误 是 没 
有 删除 那些 不 会 被 再 次 引用 的 数据 。 请 注意 , 尽管 内 存 泄漏 可 能 由 于 占用 的 存储 增多 而 降低 程 
序 运 行 的 速度 , 但 是 只 要 机 器 没有 用 完全 部 存储 , 它们 就 不 会 影响 程序 的 正确 性 。 很 多 程序 可 以 
容 处 内 存 港 漏 ， 当 泄漏 比较 缓慢 时 尤其 如 此 。 然 而 , 对 于 长 期 运行 的 程序 ,特别 是 像 操 作 系统 和 
服务 器 代码 这 样 不 间断 运行 的 程序 , 保证 它们 没有 内 存 泄漏 是 非常 关键 的 。 

自动 垃圾 回收 通过 回收 所 有 的 垃圾 而 消除 了 内 存 泄漏 问题 。 即 使 使 用 自动 垃圾 回收 机 制 ， 
程序 可 能 仍然 耗费 了 过 多 的 内 存 。 有 时 尽管 在 某 处 还 存在 着 对 某 个 对 象 的 引用 , 但 程序 员 可 能 
已 经 知道 该 对 象 不 会 再 被 引用 。 在 那 种 情况 下 , 程序 员 可 以 主动 地 删除 指向 那些 不 会 再 被 引用 
的 对 象 的 引用 , 使 得 这 些 对 象 可 以 被 自动 回收 。 








一 个 工具 实例 :Purify 

Rational 的 Purify 是 帮助 程序 员 寻 找 程序 中 的 内 存 访 问 错误 和 内 存 泄漏 的 最 常用 的 商业 
工具 之 一 。Purify 对 二 进 制 代码 进行 插 装 , 加 入 在 程序 运行 时 检查 程序 错误 的 附加 指令 。 它 
维护 了 一 个 存储 的 映像 图 , 指明 所 有 空闲 的 和 已 用 的 空间 的 分 布 。 每 个 已 分 配 空 间 的 对 象 都 
被 一 段 额 外 空间 包围 ;对 未 分 配 空间 的 访问 ,或 对 数据 对 象 之 间 的 间 际 空间 的 访问 都 被 标记 
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为 错误 。 通 过 这 种 方法 可 以 找到 一 些 悬 空 指针 引用 , 但 是 当 该 内 存 已 经 被 重新 分 配 且 该 位 置 
上 已 经 存在 一 个 有 效 对 象 时 , 这 种 方法 就 无 能 为 力 了 。 这 种 方法 还 可 以 找到 一 些 越界 的 数组 
访问 , 前 提 是 它们 恰巧 落 在 这 些 对 象 之 后 ,由 Purify 插入 的 空间 中 。 

Purify 也 可 以 在 程序 运行 结束 时 发 现 内 存 泄漏 。 它 搜索 所 有 的 已 分 配 的 对 象 中 的 内 容 ， 
找 出 所 有 可 能 的 指针 值 。 任 何 没 有 指针 指向 的 对 象 都 是 一 块 泄漏 的 存储 块 。Purify 可 以 报告 
泄漏 内 存 的 大 小 和 泄漏 对 象 的 位 置 。 我 们 可 以 将 Purify 和 一 个 “保守 的 垃圾 回收 器 ” 相 比 较 ， 
后 者 将 在 7.8.3 节 中 讨论 。 








过 度 热 衷 于 删除 对 象 可 能 引起 比 内 存 泄 漏 更 严重 的 问题 。 第 二 个 常见 的 错误 是 删除 了 某 个 
存储 空间 , 然后 又 试图 去 引用 这 个 已 回收 空间 中 的 数据 。 指 向 已 回收 空间 的 指针 称 为 悬空 指针 
(dangling pointer)。 一 旦 这 个 已 释放 的 空间 被 重新 分 配给 另 一 个 变量 , 通过 该 悬空 指针 进行 的 任 
何 读 、 写 或 回收 操作 都 可 能 产生 看 起 来 不 可 捉摸 的 结果 。 我 们 把 诸如 读 、 写 、 回 收 等 沿 着 一 个 指 
针 试 图 使 用 该 指针 所 指 对 象 的 所 有 操作 称 为 对 这 个 指针 的 “ 解 引 用 ”( dereferencing ) 。 

注意 , 通过 一 个 悬空 指针 读 取 数据 可 能 会 返回 不 确定 的 值 。 通 过 一 个 悬空 指针 进行 写 操作 
则 可 能 不 确定 地 改变 新 变量 的 值 。 回 收 一 个 悬空 指针 的 存储 空间 意味 着 这 个 新 变量 的 存储 空间 
可 能 被 分 配给 另 -一 个 变量 。 新 旧 变 量 上 的 动作 可 能 会 相互 冲突 。 

和 内 存 泄 漏 不 一 样 , 在 释放 的 空间 被 重新 分 配 之 后 再 对 相应 的 悬空 指针 进行 解 引 用 总 是 会 
带 来 难以 调试 的 程序 错误 。 因 而 ， 当 程序 员 不 能 确定 一 个 变量 是 否 还 会 被 引用 时 , 他 们 更 倾向 于 
不 回收 该 变量 。 ; 

另 一 个 相关 的 编程 错误 形式 是 访问 非法 地 址 。 这 种 错误 的 常见 例子 包括 对 空 指 针 的 解 引用 
和 访问 一 个 数组 界限 之 外 的 元 素 。 探 测 出 这 种 错误 要 好 过 任 由 程序 产生 错误 结果 。 实 际 上 , 很 
多 安全 危害 就 是 利用 了 这 种 类 型 的 程序 错误 。 其 中 ， 某 个 程序 输入 会 导致 意 想不到 的 数据 访问 ， 
使 得 一 个 黑客 取得 这 个 程序 和 机 器 的 控制 权 。 解 决 办 法 之 一 是 让 编译 器 在 每 次 访问 中 插 人 检查 
代码 ， 以 保证 该 次 访问 在 数组 界限 之 内 。 一 些 编译 器 的 优化 器 可 以 发 现 并 删除 那些 不 必要 的 检 
查 代码 , 因为 这 些 优化 器 能 够 推导 出 相应 的 访问 必然 在 区 间 之 内 。 

编程 规范 和 工具 

现在 我 们 给 出 几 个 最 流行 的 编程 规范 和 工具 , 开发 它们 的 目的 是 帮助 程序 员 来 应 对 的 存储 
管理 的 复杂 性 : 

e 当 一 个 对 象 的 生命 周期 能 够 被 静态 推导 出 来 时 ,， 对象 所 有 者 (object ownership) 的 概念 是 
很 有 用 的 。 它 的 基本 思想 是 在 任何 时 候 都 给 每 个 对 象 关 联 上 一 个 所 有 者 (owner) 。 这 个 
所 有 者 是 指向 该 对 象 的 一 个 指针 , 通常 属于 某 个 函数 调用 。 所 有 者 (也 就 是 这 个 函数 ) 负 
责 删除 这 个 对 象 或 者 把 这 个 对 象 传递 给 男 一 个 所 有 者 。 可 能 会 有 其 他 的 指针 也 指向 同一 
个 对 象 , 但 是 这 些 指 针 不 代表 拥有 关系 。 这 些 指 针 可 在 任何 时 刻 被 覆盖 , 但 是 绝对 不 应 
该 通过 它们 进行 删除 操作 。 这 个 规范 可 以 消除 内 存 泄漏 , 同时 也 可 以 避免 将 同一 对 象 删 
除 两 次 。 然 而 , 它 对 解决 悬空 指针 引用 问题 没有 帮助 , 因为 有 可 能 沿 着 一 个 不 代表 拥有 
关系 的 指针 访问 一 个 已 经 被 删除 的 对 象 。 

当 一 个 对 象 的 生命 周期 需要 动态 确定 时 ， 引 用 计数 (reference counting) 会 有 所 帮助 。 它 的 
基本 思想 是 给 每 个 动态 分 配 的 对 象 附 上 一 个 计数 。 在 指向 这 个 对 象 的 引用 被 创建 时 , 我 
们 将 此 对 象 的 引用 计数 加 一 ; 当 一 个 引用 被 删除 时 ,我 们 将 此 引用 计数 减 一 。 当 计数 变 














BLO 时 , 这 个 对 象 就 不 会 再 被 引用 , 因此 可 以 被 删除 。 然 而 , 这 个 技术 不 能 发 现 无 用 的 循 


环 数据 结构 , 其 中 的 一 组 对 象 不 能 再 被 访问 , 但 是 因为 它们 之 间 互 相 引 用 , 导致 它们 的 引 
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用 计数 不 为 0。 在 例子 7.11 中 可 以 看 到 这 个 问题 的 一 个 示例 。 引 用 计数 技术 确实 可 以 根 
除 所 有 的 悬空 指针 引用 ,， 央 为 不 存在 指向 已 删除 对 象 的 引用 。 因 为 引用 计数 在 存储 一 个 
指针 的 每 次 运算 上 增加 了 和 人 祯 外 开销 , 内 此 引用 计数 的 运行 时 刻 代 价 很 大 。 
。 对 于 其 生命 周期 局 限于 计算 过 程 中 的 某 个 特定 阶段 的 一 组 对 象 , 可 以 使 用 基于 区 域 的 分 
配 (region-based allocation) 方 法 。 当 被 创建 的 对 象 只 在 一 个 计算 过 程 的 某 个 步骤 中 使 用 
时 , 我 们 可 以 把 这 些 对 象 分 配 在 同一 个 区 域 中 。 一 旦 这 个 计算 步 又 完成 , 我们 就 删除 整 
个 区 域 。 基 于 区 域 的 分 配方 法 有 一 定 的 局 限 性 。 然 而 当 可 以 使 用 它 时 , 它 又 非常 高 效 。 
因为 该 技术 以 成 批 的 方式 一 次 性 删除 区 域 中 的 所 有 对 象 , 而 不 是 每 次 回收 一 个 对 象 。 
7.4.6 7.4 节 的 练习 
练习 7. 4. 1: 假设 堆 区 从 0 地 址 开始 编 址 , 由 几 个 存储 块 组 成 。 按 照 地 址 顺序 , 这 些 存储 块 
的 大 小 分 别 是 80, 30, 60, 50, 70, 20, 40 个 字 节 。 当 我 们 在 一 个 存储 块 中 放 人 一 个 对 象 时 ， 如 果 
该 块 中 的 剩余 空间 仍然 足以 形成 一 个 较 小 的 块 , 我 们 就 将 此 对 象 放置 在 块 的 高 端 (这 样 可 以 比较 
容易 地 把 较 小 的 块 保存 在 空闲 空间 的 链表 中 )。 然 而 , 我 们 不 能 使 用 小 于 8 个 字 节 的 存储 块 ， 因 
此 如 果 一 个 对 象 和 被 选中 的 存储 块 差不多 大 , 我 们 就 把 整个 块 分 配给 它 , 并 将 这 个 对 象 放置 在 这 
个 块 的 低 端 。 如 果 我 们 按 顺 序 为 大 小 分 别 为 32、64、48、16 的 对 象 申 请 空间 , 在 满足 了 这 些 请 求 
之 后 的 空闲 空间 列表 是 什么 样子 的 ? 假设 选择 存储 块 的 方法 是 : 
1) First-fit 
2) Best-fit 


7.5 垃圾 回收 概述 


不 能 被 引用 的 数据 通常 称 为 垃圾 (garbage) 。 很 多 高 级 程序 设计 语言 提供 了 用 以 回收 不 可 达 
数据 的 自动 垃圾 回收 机 制 , 从 而 解除 了 程序 员 进 行 手工 存储 管理 的 负担 。 垃 圾 回收 最 早出 现在 
1958 年 的 Lisp 语言 的 初次 实现 中 。 其 他 提供 垃圾 回收 机 制 的 主要 语言 包括 Java, Perl, ML, Mod- 
ula-3 、Prolog 和 Smalltalk 。 

在 本 节 中 , 我 们 将 介绍 多 个 和 垃圾 回收 相关 的 概念 。 对 象 “ 可 达 ” 这 个 概念 是 很 直观 的 , 但 
是 我 们 仍 需 要 精确 地 定义 , 准确 的 规则 将 在 7.5.2 节 中 讨论 。 我 们 将 在 7. 5.3 节 中 讨论 一 种 简单 
但 是 有 缺陷 的 自动 垃圾 回收 方法 : 引用 计数 。 它 基于 如 下 的 思想 : 一 旦 一 个 程序 失去 了 指向 一 个 
对 象 的 所 有 引用 , 它 就 不 能 并 且 也 不 会 再 引用 该 对 象 的 存储 空间 。 

7.6 节 将 讨论 基于 跟踪 的 回收 器 。 它 包含 多 个 算法 , 用 以 找 出 所 有 仍然 有 用 的 对 象 , 然后 将 
堆 区 中 所 有 的 其 他 存储 块 变 成 空闲 空间 。 

7.5.1 垃圾 回收 器 的 设计 目标 

垃圾 回收 是 重新 收回 那些 存放 了 不 能 再 被 程序 访问 的 对 象 的 存储 块 。 我 们 假定 这 些 对 象 的 
类 型 可 以 由 垃圾 回收 器 在 运行 时 刻 确定 。 基 于 这 个 类 型 信息 , 我 们 可 以 知道 该 对 象 有 多 大 ,以 及 
该 对 象 的 哪些 分 量 包含 指向 其 他 对 象 的 引用 (指针 ) 。 我 们 还 假定 对 对 象 的 引用 总 是 指向 该 对 象 
的 起 始 位 置 ， 而 不 会 指向 该 对 象 中 间 的 位 置 。 因 此 ,对 同一 个 对 象 的 所 有 引用 具有 相同 的 值 ,可 
以 被 很 容易 地 识别 。 

我 们 把 一 个 用 户 程 序 称 为 增 变 者 (mutator)， 它 会 修改 堆 区 中 的 对 象 集合 。 增 变 者 从 存储 管 
理 器 处 获取 空间 , 创建 对 象 , 它 还 可 以 引入 和 消除 对 已 有 对 象 的 引用 。 当 增 变 者 程序 不 能 “到 
O APEYA, 这 些 对 象 就 变 成 了 垃圾 。 在 7.5.2 节 中 将 给 出 “到 达 ” 的 准确 定义 。 垃 圾 回收 器 
找到 这 些 不 可 达 对 象 , 并 将 这 些 对 象 交 给 跟踪 空闲 空间 的 存储 管理 器 , 收回 它们 所 占 的 空间 。 
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一 个 基本 要 求 : 类 型 安全 
不 是 所 有 的 语言 都 适合 进行 自动 垃圾 回收 。 为 了 使 垃圾 回收 器 能 够 工作 , 它 必须 知道 任何 
给 定 的 数据 元 素 或 一 个 数据 元 素 的 分 量 是 否 为 (或 可 和 否 被 用 作 ) 一 个 指向 某 块 已 分 配 存储 空间 的 
指针 。 在 一 种 语言 中 , 如 果 任 何 数据 分 量 的 类 型 都 是 可 确定 的 , 那么 这 种 语言 就 称 为 类 型 安全 
(typesafe) 的 。 对 于 某 些 类 型 安全 的 语言 ， 比 如 ML, 我 们 可 以 在 编译 时 刻 确 定数 据 的 类 型 。 另 外 
一 些 类 型 安全 语言 ， 比 如 Java, 其 类 型 不 能 在 编译 时 刻 确 定 , 但 是 可 以 在 运行 时 刻 确定 。 后 者 称 
为 动态 类 型 (dynamically typed) 语 言 。 如 果 一 个 语言 既 不 是 静态 类 型 安全 的 , 也 不 是 动态 类 型 安 
全 的 ， 它 就 被 称 为 不 安全 的 (unsafe) o 

类 型 不 安全 的 语言 不 适合 使 用 自动 垃圾 回收 机 制 。 遗 憾 的 是 ， 有 些 最 重要 语言 却 是 类 型 不 
安全 的 , 比如 C 和 C++ 。 在 不 安全 语言 中 , 存储 地 址 可 以 进行 任意 操作 ; 可 以 将 任意 的 算术 运 
算 应 用 于 指针 , 创建 出 一 个 新 的 指针 , 并 且 任 何 整数 都 可 以 被 强制 转化 为 指针 。 因 此 ,从 理论 上 
来 说 ,一 个 程序 可 以 在 任何 时 候 引 用 内 存 中 的 任何 位 置 。 这 样 ， 没 有 哪个 内 存 位 置 可 以 被 认为 是 
不 可 访问 的 , 也 就 无 法 安全 地 收回 任何 存储 空间 。 

在 实践 中 , 大 部 分 C 和 C++ 程序 并 没有 随意 地 生成 指针 。 因 此 人 们 开发 了 一 个 在 理论 上 不 
正确 , 但 是 实践 经 验 表 明 很 有 效 的 垃圾 回收 器 。 我 们 将 在 7.8.3 节 中 讨论 用 于 C 和 C++ 语言 的 
保守 的 垃圾 回收 技术 。 

性 能 度量 

尽管 在 几 十 年 前 就 发 明了 垃圾 回收 机 制 , 并 且 它 能 够 完全 防止 内 存 泄漏 , 但 是 垃圾 回收 的 代 
价 是 如 此 高 昂 , 所 以 至 今 没有 被 很 多 主流 的 程序 设计 语言 使 用 。 在 多 年 的 研究 中 , 很 多 不 同 的 回 
收 方法 被 提出 来 , 但 是 还 没有 一 种 无 可 争议 的 最 好 的 垃圾 回收 算法 。 在 讨论 这 些 方法 之 前 , 我 们 
首先 列举 一 些 在 设计 垃圾 回收 器 时 必须 考虑 的 性 能 度量 标准 。 

e 总 体 运行 时 间 。 垃 圾 回收 的 速度 可 能 会 很 慢 。 使 它 不 会 显著 增加 一 个 应 用 程序 的 总 运行 
时 间 是 很 重要 的 。 因 为 垃圾 回收 器 必须 要 访问 很 多 数据 , 它 的 性 能 很 大 程度 上 决定 于 它 
能 否 充分 利用 存储 子 系统 。 
空间 使 用 。 重 要 之 处 在 于 垃圾 回收 机 制 避免 了 内 存 碎片 , 并 最 大 限度 地 利用 了 可 用 内 存 。 
停顿 时 间 。 简 单 的 垃圾 回收 器 有 一 个 众所周知 的 问题 , 即 垃 圾 回收 过 程 会 在 没有 任何 预 
警 的 情况 下 突然 启动 ,导致 程序 ( 即 增 变 者 ) 突 然 长 时 间 停 顿 。 因 此 , 除了 最 小 化 总 体 运 
行 时 间 之 外 ,人 们 还 希望 将 最 长 停顿 时 间 最 小 化 。 作 为 一 个 重要 的 特例 , 实时 应 用 要 求 
某 些 计算 在 一 个 时 间 界 限 内 完成 。 我 们 要 么 在 执行 实时 任务 时 压制 住 垃 圾 回收 过 程 , 要 
么 限定 最 长 停顿 时 间 。 央 此 , 垃圾 回收 机 制 很 少 在 实时 应 用 中 使 用 。 

© 程序 局 部 性 。 我 们 不 能 只 通过 一 个 垃圾 回收 器 的 运行 时 间 来 评价 它 的 速度 。 垃 圾 回收 需 

控制 了 数据 的 放置 ， 因 此 影响 了 增 变 者 程序 的 数据 局 部 性 。 它 可 以 通过 释放 空间 并 复 用 
该 空间 来 改善 增 变 者 程序 的 时 间 局 部 性 ; 它 也 可 以 将 那些 一 起 使 用 的 数据 重新 放置 在 同 
一 个 高 速 缓存 线 或 内 存 页 上 ， 从 而 改善 程序 的 空间 局 部 性 。 

这 些 设 计 目 标 中 的 某 些 目标 可 能 互相 冲突 , 设计 者 必须 在 认真 考虑 程序 的 典型 行为 之 后 作 
出 权衡 。 不 同 特性 的 对 象 可 能 适 会 全 用 不 同 的 处 理 方式 ， 这 就 要 求 垃圾 回收 器 使 用 不 同 的 技术 
来 处 理 不 同类 型 的 对 象 。 

例如 , 已 分 配 的 对 象 数量 中 小 对 象 的 数量 很 大 比例 , 那么 对 小 对 象 的 分 配 不 能 产生 大 的 开 
销 。 男 一 方面 , 考虑 一 下 对 可 达 对 象 进行 重 定位 的 垃圾 问 收 器 。 在 处 理 大 对 象 时 重新 定位 是 非 
常 昂贵 的 , 但 在 处 理 小 对 象 时 代价 就 比较 小 。 : 
考虑 另 一 个 例子 。 一 般 来 说 , 在 基于 跟踪 的 回收 器 中 , 我 们 等 待 垃圾 回收 的 时 间 越 长 , ATE 
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收 对 象 的 比例 就 越 大 。 原 内 在 于 很 多 对 象 常 常 “ 克 年 早 逝 ”, 因此 如 果 我 们 等 一 段 时 间 , 很 多 新 
分 配 的 对 象 就 会 变 成 不 可 达 的 。 这 样 的 回收 器 平均 花 在 每 个 被 回收 对 象 上 的 开销 就 会 变 小 。 另 
一 方面 , 降低 回收 频率 会 增加 程序 的 内 存 使 用 要 求 ， 降低 数据 局 部 性 ， 并 增加 停顿 时 间 。 

相 比 之 下 ,一 个 使 用 引用 计数 的 回收 器 给 增 变 者 的 每 次 运算 引入 一 个 常量 开销 ,从 而 明显 地 


减 慢 程序 的 整体 运行 速度 。 但 是 另 一 方面 , 引用 计数 技术 不 会 产生 长 时 间 的 停顿 , 并 且 能 够 有 效 
地 利用 内 存 , 因为 它 可 以 在 垃圾 产生 时 立刻 发 现 它们 (除了 7.5.3 节 中 将 讨论 的 特定 的 循环 结 
构 )。 


语言 的 设计 同样 会 影响 内 存 使 用 的 特性 。 有 些 语 言 提倡 的 程序 设计 风格 会 产生 很 多 垃圾 。 
比如 ， 冰 数 式 (或 者 几乎 函数 式 ) 的 程序 设计 语言 为 了 避免 改变 已 存在 的 对 象 , 会 创建 出 更 多 的 
对 象 。 在 Java 中 , 除了 整 型 和 引用 这 样 的 基本 类 型 ,所 有 的 对 象 都 被 分 配 在 堆 区 而 不 是 栈 区 。 即 
使 这 些 对 象 的 生命 周期 被 限制 在 一 次 函数 调用 的 生命 周期 内 ,它们 仍然 被 分 到 堆 区 中 。 这 种 设 
计 使 得 程序 员 不 需要 关注 变量 的 生命 周期 , 但 是 其 代价 是 产生 更 多 的 垃圾 。 已 经 有 一 些 编译 器 
优化 技术 可 以 分 析 变 量 的 生命 周期 , 并 尽 可 能 地 将 它们 分 配 到 栈 区 。 
7. 5.2 可 达 性 

我 们 把 所 有 不 需要 对 任何 指针 解 引 用 就 可 以 被 程序 直接 访问 的 数据 称 为 根 集 (root set) 。 例 
如 , 在 Java H, 一 个 程序 的 根 集 由 所 有 的 静态 字段 成 员 和 栈 中 的 所 有 变量 组 成 。 显 然 , 程序 可 以 
在 任何 时 候 访 问 根 集中 的 任何 成 员 。 递 归 地 , 对 于 任意 ~- 个 对 象 , 如 果 指 向 它 的 一 个 引用 被 保存 
在 任何 可 达 对 象 的 字段 成 员 或 数组 元 素 中 , 那么 这 个 对 象 本 身 也 是 可 达 的 。 

当 程 序 被 编译 器 优化 之 后 ,可 达 性 问题 会 变 得 更 加 复杂 。 首 先 , 编译 器 可 能 会 把 引用 变量 放 
在 寄存 器 中 。 这 些 引用 也 必须 被 看 做 是 根 集 的 一 部 分 。 其 次 ,尽管 在 一 个 类 型 安全 语言 中 , 程序 
员 不 能 直接 操作 内 存 地 址 , 但 是 编译 器 常常 会 为 了 提高 代码 速度 而 这 么 做 。 因 此 , 编译 得 到 的 代 





存 器 中 的 值 上 , 计算 得 到 一 个 合法 地 址 。 为 了 使 得 垃圾 回收 器 能 够 找到 正确 的 根 集 , 优化 编译 器 


可 以 做 如 下 的 处 理 : 
o 编译 器 可 以 限制 垃圾 回收 机 制 只 能 在 程序 中 的 某 些 代码 点 上 被 激活 。 在 这 些 点 上 没有 


“隐藏 "的 引用 。 
。 编译 器 可 以 写 出 一 些 信息 供 垃圾 回收 器 恢复 所 有 的 引用 。 上 比如 , 指出 哪些 寄存 器 中 包含 
了 引用 , 或 者 如 何 根据 给 定 的 某 个 对 象 的 内 部 地 址 来 计算 该 对 象 的 基地 址 。 
o 编译 器 可 以 确保 当 垃圾 回收 器 被 激活 时 每 个 可 达 对 象 都 有 一 个 引用 指向 它 的 基地 址 。 
可 达 对 象 的 集合 随 着 程序 的 执行 而 变化 。 当 新 对 象 被 创建 时 该 集合 会 增长 ， 当 某 些 对 象 变 
得 不 可 达 时 该 集合 就 缩小 。 重 要 的 是 记 住 一 旦 某 个 对 象 变 得 不 可 达 , 它 就 不 可 能 再 次 变 得 可 达 。 
下 面 是 一 个 增 变 者 程序 改变 可 达 对 象 集合 的 四 种 基本 操作 : 
。 对 象 分 配 。 这 些 操作 由 存储 管理 器 完成 。 它 返回 一 个 指向 新 创建 的 存储 区 域 的 引用 。 这 
个 操作 向 可 达 对 象 集中 添加 成 员 。 
参数 传递 和 返回 值 。 对 象 引 用 从 实在 输入 参数 传递 到 相应 的 形式 参数 , 也 可 以 从 返回 结 
果 传 回 给 调用 者 。 这 些 引 用 指向 的 对 象 仍然 是 可 达 的 。 
引用 赋值 。 对 于 引用 和 w, JEA u =o 的 赋值 语句 有 两 个 效果 。 首 先 , u 现在 是 v 所 指 对 
象 的 一 个 引用 。 只 要 u 是 可 达 的 , 那么 它 指向 的 对 象 当然 也 是 可 达 的 。 其 次 , u 中 原来 的 
引用 丢失 了 。 如 果 这 个 引用 是 指向 某 一 可 达 对 象 的 最 后 一 个 引用 , .那么 那个 对 象 就 变 成 
不 可 达 的 。 当 某 个 对 象 变 得 不 可 达 时 , 所 有 只 能 通过 这 个 对 象 中 的 引用 到 达 的 对 象 都 会 
变 成 不 可 达 的 。 
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o 过 程 返回 。 当 一 个 过 程 退出 时 , 保存 其 局 部 变量 的 活动 记录 将 被 弹出 栈 。 如 果 这 个 活动 记 
录 中 保存 了 某 个 对 象 的 唯一 引用 , 那个 对 象 就 变 得 不 可 达 。 同 样 , 如 果 这 个 刚刚 变 得 不 可 达 
的 对 象 保存 了 指向 其 他 对 象 的 唯一 引用 , 那么 那些 对 象 也 将 变 得 不 可 达 , 以 此 类 推 。 
AMAZ, 新 的 对 象 通过 对 象 分 配 被 引入 。 参 数 传递 和 赋值 可 以 传递 可 达 性 ; 赋值 和 过 程 结 
束 可 能 结束 对 象 的 可 达 性 。 当 一 个 对 象 变 得 不 可 达 时 ,可 能 会 导致 更 多 的 对 象 变 得 不 可 达 。 





栈 对 象 的 残存 问题 
当 一 个 过 程 被 调用 时 ,一 个 局 部 变量 " 的 对 象 被 分 配 在 栈 中 。 可 能 会 有 一 些 指 向 ” 的 指 
针 被 放置 在 非 局 部 变量 中 。 这 些 指针 将 在 这 个 过 程 返回 之 后 继续 存在 , 但 是 存放 * 的 空间 消 
KT, 从 而 产生 了 一 个 悬空 指针 的 情况 。 我 们 是 否 应 该 象 C 所 作 的 那样 将 象 " 这样 的 局 部 变 
量 分 配 在 栈 中 呢 ? 答案 是 很 多 语言 的 语义 要 求 局 部 变量 在 它们 的 过 程 返回 后 不 再 存在 。 保 留 
一 个 指向 这 样 的 变量 的 引用 是 一 个 编程 错误 , 不 会 要 求 编译 器 去 改正 程序 中 的 这 个 错误 。 











有 两 种 寻找 不 可 达 对 象 的 基本 方法 。 我 们 可 以 捕获 可 达 对 象 变 得 不 可 达 的 转变 时 刻 , 也 可 
以 周期 性 地 定位 出 所 有 可 达 对 象 , 然后 推出 所 有 其 他 对 和 象 都 是 不 可 达 的 。7.4.5 节 中 介绍 的 引用 
计数 技术 是 一 种 著名 的 近似 实现 第 一 种 方法 的 技术 。 我 们 在 增 变 者 执行 可 能 改变 可 达 对 象 集合 
的 动作 时 , 维护 了 指向 各 个 对 象 的 引用 的 计数 。 当 计数 器 变 成 0 时 ,相应 的 对 象 变 得 不 可 达 。 我 
们 将 在 7. 5.3 节 中 更 详细 地 讨论 这 个 方法 。 

第 二 种 方法 传递 地 跟踪 所 有 的 引用 ,从 而 计算 可 达 性 。 一 个 基于 跟踪 的 垃圾 回收 器 首先 为 
根 集中 的 所 有 对 象 加 上 “可 达 的 "标号 , 然后 重复 地 检查 可 达 对 象 中 的 所 有 引用 , 找到 更 多 的 可 
AMA, 并 为 它们 加 上 同样 的 标号 。 这 个 方法 必须 首先 跟踪 所 有 的 引用 , 然后 才能 决定 哪些 对 象 
是 不 可 达 的 。 但 是 一 旦 计算 得 到 可 达 集 合 , 它 就 可 以 立刻 找到 很 多 不 可 达 对 象 , 并 同时 确定 大 量 
的 空闲 存储 空间 。 因 为 所 有 的 引用 都 必须 在 同一 时 刻 进行 分 析 , 所 以 我 们 还 可 以 选择 将 可 达 对 
象 重新 定位 ， 从 而 减少 碎片 。 有 很 多 种 不 同 的 基于 跟踪 的 算法 , 我 们 将 在 7.6 节 和 7.7.1 节 中 讨 
论 这 些 可 选 算法 。 

7.5.3 引用 计数 垃圾 回收 器 

现在 , 我 们 考虑 一 个 简单 但 有 缺陷 的 基于 引用 计数 的 垃圾 回收 器 。 当 一 个 对 象 从 可 达 转 变 
为 不 可 达 的 时 候 , 该 回收 器 就 可 以 将 该 对 象 确 认为 垃 圾 ; 当 一 个 对 象 的 引用 计数 为 0 时 , 该 对 象 
就 会 被 删除 。 使 用 引用 计数 的 垃 圾 回收 器 时 ,每 个 对 象 必 须 有 一 个 用 于 存放 引用 计数 的 字段 。 
引用 计数 可 以 按照 下 面 的 方法 进行 维护 : 

1) 对 象 分 配 。 新 对 象 的 引用 计数 被 设置 为 1。 

2) 套数 传递 。 被 传递 给 一 个 过 程 的 每 个 对 象 的 引用 计数 加 一 。 

3) 引用 赋值 。 如 果 和 ww 都 是 引用 , 对 于 语句 w=w,v 指 向 的 对 象 的 引用 计数 加 1,w 本 来 指 
向 的 原 对 象 的 引用 计数 减 1。 

4) 过 程 返 回 。 当 一 个 过 程 退出 时 , 该 过 程 活 动 记录 的 局 部 变量 中 所 指向 的 对 象 的 引用 数 必 
须 减 一 。 如 果 多 个 局 部 变量 存放 了 指向 同一 对 象 的 引用 , 那么 对 每 个 这 样 的 引用 , 该 对 象 的 引用 
计数 都 要 减 1 。 

5) 可 达 性 的 传递 丢失 。 当 一 个 对 象 的 引用 计数 变 成 0 时, 我 们 必须 将 该 对 象 中 的 各 个 引用 
所 指向 的 每 个 对 象 的 引用 计数 减 1。 

引用 计数 有 两 个 主要 的 缺点 : 它 不 能 回收 不 可 达 的 循环 数据 结构 , 并 且 它 的 开销 较 大 。 循 环 
数据 结构 的 出 现 都 是 有 理由 的 : 数据 结构 常常 会 指 回 到 它们 的 父 结 点 , 也 可 能 相互 指向 对 方 , 从 
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而 形成 交叉 引用 。 
‘beam 图 7-18 给 出 了 三 个 对 象 以 及 
它们 之 间 的 引用 , 但 是 没有 来 自 其 他 部 
分 的 引用 。 如 果 这 些 对 象 都 不 是 根 集 的 
RA, 那么 它们 都 是 垃圾 ， 的 
引用 计数 都 大 于 0。 如 果 我 们 在 垃圾 回 
收 中 使 用 引用 计数 技术 , 这 个 情况 就 等 
同 于 一 次 内 存 泄漏 ,因为 这 种 垃圾 以 及 
任何 类 似 的 结构 永远 不 会 会 被 回收 。 图 7-18 一 个 不 可 达 的 循环 数据 结构 

引用 计数 的 开销 比较 大 , 因为 每 一 次 引用 赋值 ,以 及 在 每 个 过 程 的 人 口 和 出 日 处 ,都 会 增加 
一 个 额外 运算 。 这 个 开销 和 程序 中 的 计算 量 成 正比 关系 ， 而 不 仅仅 和 系统 中 的 对 象 数目 相关 。 
需要 特别 考虑 的 是 对 一 个 程序 的 根 集中 的 引用 的 更 新 。 局 部 栈 访问 会 引起 引用 计数 的 更 新 ,为 
了 消除 因 这 种 更 新 而 引起 的 时 间 开 销 ， 人 们 提出 了 延期 引用 计数 的 概念 。 也 就 是 说 , 引用 计数 不 
包括 来 自 程序 根 集 的 引用 。 除 非 扫 摘 整个 根 集 仍 没有 找到 指向 某 一 对 象 的 引用 , 否则 这 个 对 象 
不 会 被 当 作 垃圾 。 

另 一 方面 ， 引用 计数 的 优势 在 于 垃圾 回收 是 以 增 量 方式 完成 的 。 尽 管 总 的 开销 可 和 ERK, 但 
这 些 运算 分 布 在 增 变 者 的 整个 计算 过 程 中 。 尽 管 删 除 一 个 引用 可 能 致使 大 量 对 象 变 得 不 可 达 ， 
我 们 可 以 很 容易 地 延期 执行 递归 地 修改 引用 计数 的 运算 , 并 在 不 同 的 时 间 点 上 逐步 完成 修改 。 
因此 ， 当 应 用 必须 满足 某 个 时 间 期 限时 , 或 者 对 于 不 能 接受 长 时 间 突 然 停顿 的 交互 式 系统 而 言 ， 
引用 计数 是 一 种 特别 有 吸引 力 的 算法 。 这 个 方法 的 另 一 种 优势 是 垃圾 被 及 时 回收 ， 从 而 保持 了 
较 低 的 空间 使 用 量 。 
7.5.4 7.5 节 的 练习 . 

练习 7. 5. 1: 当下 列 事件 发 生 时 , 图 7-19 中 的 对 象 的 引用 计数 会 发 生 哪 些 改变 ? 

1) 从 A 指向 B 的 指针 被 姓 除 。 

2) 从 X 指 向 A 的 指针 被 删除 。 

3) 结 点 C 被 删除 。 

练习 7. 5. 2: 4E 7-20 中 的 从 A 到 D 的 指针 被 删除 时 , 引用 计数 会 发 生 什 么 样 的 改变 ? 


Pea 没有 来 自 
= 、、 外 Anise 















































图 7-19 一 个 对 象 网 络 图 7-20” 另 一 个 对 象 网 络 
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7.6 基于 跟踪 的 回收 的 介绍 


基于 跟踪 的 回收 器 并 不 在 垃圾 产生 的 时 候 就 进行 回收 ， 而 是 会 周期 性 地 运行 ,寻找 不 可 达 对 
象 并 收回 它们 的 空间 。 通 常 的 做 法 是 在 空闲 空间 被 耗 尽 或 者 空闲 空间 数量 低 于 某 个 阔 值 时 启动 
垃圾 回收 器 。 

在 本 节 中 , 我 们 首先 介绍 最 简单 的 "标记 -清扫 式 " 垃 圾 回收 算法 。 然 后 我 们 将 通过 存储 块 
可 能 具有 的 四 种 状态 来 描述 多 个 基于 跟踪 的 算法 。 这 一 节 中 还 包含 了 一 些 对 基本 算法 的 改进 ， 
包 插 那些 将 对 象 重 定 位 加 入 到 垃圾 回收 功能 中 的 算法 。 

7.6.1 基本 的 标记 -清扫 式 回 收 器 

标记 — 清扫 式 (mark-and-sweep) 垃 圾 回收 算法 是 一 种 直接 的 全 面 停顿 的 算法 。 它 们 找 出 所 有 
不 可 达 的 对 象 , 并 将 它们 放 人 空闲 空间 列表 。 算 法 7. 12 在 一 开始 的 跟踪 步 又 中 访问 并 “标记 "所 
有 的 可 达 对 象 , 然后 “清扫 ”整个 堆 区 并 释放 不 可 达 对 象 。 在 介绍 了 基于 跟踪 的 算法 的 一 个 一 般 
性 框架 之 后 , 我 们 将 考虑 算法 7.14, 它 是 算法 7. 12 的 一 个 优化 。 算 法 7.14 使 用 一 个 附加 的 列表 
来 保存 所 有 已 分 配对 象 , 使 得 它 对 每 个 可 达 对 象 只 访问 一 次 。 

B47. 12 Bee 清扫 式 垃圾 回收 。 

JA: 一 个 由 对 象 组 成 的 根 集 ， 一 个 堆 和 一 个 被 称 为 mree 的 包含 了 堆 中 所 有 未 分 配 存储 块 的 
空闲 空间 列表 (free list)。 和 7.4.4 节 中 一 样 , 所 有 空间 块 都 用 边界 标记 进行 标识 ,指明 它们 的 容 
闲 / 已 用 状态 和 大 小 。 

和 输出: 在 删除 了 所 有 垃圾 之 后 的 经 过 修改 的 Free 列表 。 

方法 : 在 图 7-21 中 显示 的 算法 使 用 了 几 个 简单 的 数据 结构 。 列 表 Free 保存 了 已 知 的 空闲 对 
象 。 一 个 名 为 Unscanned 的 列表 保存 了 我 们 已 经 确定 可 达 的 对 象 , 但 是 我 们 还 没有 考虑 这 些 对 象 
的 后 继 对 象 的 可 达 性 。 也 就 是 说 , 我 们 还 没有 扫描 这 些 对 象 来 确定 通过 它们 能 够 到 达 哪 些 对 象 。 
列表 Unscanned 最 初 为 空 。 另 外 , 每 个 对 象 包 括 一 个 比特 ,用 来 指明 该 对 象 是 否 可 达 ( 即 reached 
位 ) 。 在 算法 开始 之 前 ,所 有 已 分 配对 象 的 reached 位 都 被 设 定 为 0。 

| 




















标记 阶段 */ 
/* 把 被 根 集 引 用 的 每 个 对 和 象 的 reached 位 设置 为 !， 并 把 它 加 入 
到 Unscanned 列表 中 ; */ 


= 


2) while (Unscanned £ 6) { 
3) 从 Unscanned 列表 中 删除 某 个 对 象 ; 
4) for {在 o P51 FANE THR o ) { 
5) if (of 尚未 被 访问 到 :， 即 它 的 reached 位 为 0) { 
6) 将 of 的 reached 位 设置 为 T; 
7) 0! A Unscanned 中 : 
} 
/* FAT * 
8) Free= 0; 
9) for CHER H IAI AE PY ) { 
10) if (o 未 被 访问 到 ， 即 它 的 reached 位 为 0) 将 0 加 入 到 Freet; 
11) else 将 0 的 reached 位 设置 为 0 5 | 
} 









图 7-21 一 个 标记 - 清扫 式 垃圾 回收 器 
在 图 7-21 的 第 (1) 行 , 我 们 初始 化 Unscanned 列表 , 在 其 中 放 人 所 有 被 根 集 引 用 的 对 象 。 同 
时 这 些 对 象 的 reached 位 被 设置 为 1。 第 (2) 行 到 第 (7) 行 是 一 个 循环 , 在 此 循环 中 我 们 逐个 检查 
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每 个 已 经 被 放 人 Unscanned 列表 中 的 对 象 o。 

从 第 (4) 行 到 第 (7) 行 的 for 循环 实现 了 对 对 象 o 的 扫描 。 我 们 检查 每 个 在 o 中 被 引用 的 对 象 
oo WE o' 已 经 被 访问 过 (其 reached 位 为 1), 那么 就 不 需要 对 o' 做 任何 处 理 ; 它 要 么 已 经 在 之 前 
被 扫描 过 , 要 么 已 经 在 Unscarmed 列表 中 等 待 扫描 。 然 而 ,如果 o 还 没有 被 访问 到 , WARNE 
要 在 第 (6) 行 将 它 的 reached 位 设置 为 1, 并 在 第 (7) 行 中 将 o' 加 入 到 Unscanned 列表 中 。 图 7-22 
说 明了 这 个 过 程 。 它 显示 了 一 个 带 有 四 个 对 象 的 Unscarmed 列表 。 列 表 中 的 第 一 个 对 象 对 应 于 上 
述 讨论 中 的 对 象 o。。 它 正在 被 扫描 。 虚 线 对 应 于 可 能 从 o 到 达 的 三 种 类 型 的 对 象 : 

1) 之 前 扫描 过 的 对 象 , 它 不 需要 被 再 次 扫描 。 

2) 当前 在 Unscanned 列表 中 的 对 象 。 

3) 一 个 可 达 的 数据 项 , 但 是 之 前 它 被 认为 是 未 被 访问 的 。 





















































Unscanned 








空闲 的 和 未 被 访问 过 的 对 象 
reached 位 =0 


待 扫描 的 及 之 前 已 经 扫描 过 的 对 象 


reached 位 =! 


7-22 ”一 个 标记 - 清扫 式 垃圾 回收 器 的 标记 阶段 中 对 象 之 间 的 关系 
第 (8) 行 到 第 (11) 行 是 清扫 阶段 , 它 收回 所 有 那些 在 标记 阶段 结束 之 后 仍然 未 被 访问 到 的 对 
象 的 空间 。 请 注意 , 这 些 对 象 将 包括 所 有 原本 就 在 Free 列表 中 的 对 象 。 因 为 无 法 直接 枚 举 不 可 
达 对 象 的 集合 , 这 个 算法 将 清扫 整个 堆 区 。 第 (10) 行 将 空闲 且 不 可 达 的 对 象 逐 个 放 人 Fre 列表 。 
第 (11) 行 处 理 可 达 对 象 。 我 们 将 它们 的 reached 位 设 为 0， 以便 在 这 个 垃圾 回收 算法 下 一 次 运行 








时 ， 其 前 置 条 件 得 到 满足 。 o 
7.6.2 基本 抽象 分 本 

所 有 基于 跟踪 的 算法 都 计算 可 达 对 象 集 T= Gina) 
合 ,然后 取 这 个 集合 的 补 集 。 因 此 ， 内存 是 a) HERZ. Sater abt 


按照 下 列 方式 循环 使 用 的 : 


1) 程序 (或 者 说 增 变 者 ) 运行 并 发 出 分 






从 根 集 
访问 到 








待 扫描 的 

2) 垃圾 回收 器 通过 跟踪 揭示 可 达 性 。 
3) 垃圾 回收 器 收回 不 可 达 对 象 的 存储 b) 通过 跟踪 发 现 可 达 性 

空间 。 


图 7-23 按照 存储 块 的 四 种 状态 ( & 


的 、 未 被 访问 的 、 待 扫描 的 和 已 扫描 的 ) 说 


明 这 个 循环 。 一 个 存 依据 的 状态 可 以 存储 在 Com KA 


该 块 内 部 ,也 可 以 使 用 垃圾 回收 算法 的 某 个 TT 
数据 结构 隐 含 地 表示 。 


虽然 不 同 的 基于 跟踪 的 算法 可 能 在 实现 图 7-23 在 一 个 垃圾 回收 循环 中 的 存储 块 的 状态 
方法 上 有 所 不 同 , 但 是 它们 都 可 以 通过 下 列 状态 进行 描述 ; 
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1) SA, TRIE Se RASA EAT BE, AI, he RR AEREA 
达 对 象 。 

2) 未 被 访问 的 。 除 非 通过 跟踪 证 明 存储 块 可 达 ， 否则 它 被 默认 为 是 不 可 达 的 。 在 垃圾 回收 
过 程 中 的 任何 时 刻 ， 如果 还 没有 确定 一 个 块 的 可 达 性 , 该 块 就 处 于 未 被 访问 的 状态 。 如 图 7-23a 
所 示 ， 当 一 个 存储 块 被 存储 管理 器 分 配 出 去 时 , 它 的 状态 就 被 设置 为 未 被 访问 的 。 一 轮 垃圾 回收 
ZE, 可 达 对 象 的 状态 仍然 会 被 重 置 为 未 被 访问 状态 ， 以 准备 下 一 轮 处 理 , 参见 图 中 从 已 扫描 状 
态 到 未 被 访问 状态 的 转换 。 这 个 转换 用 虚线 显示 , 以 强调 它 是 为 下 一 轮 处 理 做 准备 。 

3) 待 扫描 的 。 已 知 可 达 的 存储 块 要 么 处 于 待 扫描 状态， 要么 处 于 已 扫描 状态 。 如 果 已 知 一 
个 存储 块 是 可 达 的 ,但 是 该 块 中 的 指针 还 没 被 扫描 ,那么 该 块 就 处 于 待 扫 描 状 态 。 当 我 们 发 现 蘑 
个 块 可 达 时 ， 就 会 发 生 一 个 从 未 被 访问 状态 到 待 扫描 状态 的 转换 ,如 图 7-23b 所 示 。 

4) 已 扫描 的 。 每 个 待 扫 措 对 象 最 终 都 将 被 扫描 并 转换 到 已 扫描 状态 。 在 扫描 一 个 对 象 时 ， 
我 们 检查 其 内 部 的 各 个 指针 , 并 且 没 着 这 些 指针 找到 它们 引用 的 对 象 。 如 果 引 用 指向 一 个 未 被 
访问 的 对 象 , 那么 该 对 象 将 被 设 为 待 扫 措 状态 。 当 对 一 个 对 象 的 扫描 结束 时 ,这 个 对 象 被 放 人 已 
扫描 状态 ， 见 7-23b 中 下 面 的 转换 。 一 个 已 扫描 的 对 象 只 能 包含 指向 其 他 已 扫描 或 待 扫 措 对象 的 
引用 , 决 不 会 包含 指向 未 被 访问 对 象 的 引用 。 

当 不 再 有 对 象 处 于 待 扫 描 状态 时 ， 可 达 性 的 计算 就 完成 了 。 到 最 后 仍然 处 于 未 被 访问 状态 
的 对 象 确实 是 不 可 达 的 。 垃 级 回收 器 收回 它们 占用 的 空间 , 并 将 这 些 存 储 块 置 于 空闲 的 状态 ,如 
图 7-23e 中 实 线 转 换 所 示 。 为 了 准备 下 一 轮 垃圾 回收 , 处 于 已 扫描 状态 中 的 对 象 将 回 到 未 被 访问 
状态 , 见 图 7-23c 中 的 虚线 转换 。 再 次 提醒 大 家 , 这 些 对 象 现在 确实 是 可 达 的 。 将 它们 设 定 为 未 
被 访问 状态 是 正确 的 , 因为 当下 一 轮 垃圾 回收 开始 时 ,我 们 将 要 求 所 有 对 象 都 从 这 个 状态 出 发 。 
在 那个 时 候 ， 当 前 可 达 的 某 些 对 象 可 能 实际 上 已 经 被 变 成 了 不 可 达 的 。 

AE 我 们 看 一 下 算法 7. 12 中 的 数据 结构 与 上 面 介绍 的 四 种 状态 有 什么 关系 。 使 用 reached 
位 , 以 及 是 否 在 列表 Free 和 Unscanned 中 ,我 们 可 以 区 分 全 部 四 种 状态 。 图 7-24 中 的 表格 归纳 了 











用 算法 7. 12 中 的 数据 结构 来 刻画 四 种 状态 的 方式 。 口 
状态 在 列表 所 ee 中 在 Unscanmned 列 表 中 Reached 位 
空闲 是 Eg 0 
未 被 访问 的 否 EN 0 
待 扫描 ES 是 1 
cpi A T 1 | 











图 7-24 算法 7.12 中 状态 的 表示 方式 


7.6.3 标记 -清扫 式 算 法 的 优化 

基本 的 标记 - 清扫 式 算法 的 最 后 一 步 的 代价 很 大 , 因为 没有 一 个 容易 的 方法 可 以 不 用 检查 
整个 堆 区 就 找到 所 有 不 可 达 对 象 。 由 Baker 提出 的 一 个 优化 算法 用 一 个 列表 记录 了 所 有 已 分 配 
的 对 象 。 我 们 必须 将 不 可 达 对 象 的 存储 返回 给 空闲 空间 。 为 了 找 出 不 可 达 对 象 的 集合 , 我 们 可 
以 求 已 分 配对 象 和 可 达 对 象 之 间 的 差 集 。 
Baker 的 标记 - 清扫 式 回收 器 。 

输入 : 一 个 由 对 象 组 成 的 根 集 , 一 个 堆 区 , 一 个 空闲 列表 Free, 一 个 名 为 Unreached 的 已 分 配 
对 象 的 列表 。 

输出 : 经 过 修改 的 Free 列表 和 Unreached 列表 。Unreached 列表 保存 了 被 分 配 的 对 象 。 

方法 : 这 个 算法 如 图 725 所 示 。 算 法 中 用 于 垃圾 回收 的 数据 结构 是 名 字 分 别 为 Free, 





运行 时 剂 环境 moe 





Unreached ,Unscanned , Scanned 的 四 个 列表 。 这 些 列表 分 别 保 存 了 处 于 空闲 、 未 被 访问 、 待 扫 措 和 
已 扫描 状态 上 的 所 有 对 象 。 像 7.4.4 节 中 讨论 的 那样 ,这些 列表 可 以 通过 敌人 式 的 双重 链表 来 实 
现 。 对 象 中 的 reached 位 没有 被 使 用 , 但 是 我 们 假定 每 个 对 象 中 都 包含 了 一 些 二 进 制 位 , 指明 该 
对 象 处 于 上 述 四 个 状态 的 哪 一 个 。 最 初 ，Free 就 是 由 存储 管理 咒 维 护 的 空闲 列表 ,所 有 已 分 配 的 
对 象 都 在 Unreached 列表 中 (这 个 表 同 时 也 由 存储 管理 器 在 为 对 象 分 配 存储 块 时 维护 )。 

a ee a l 
1) Scanned = 6; 
2) Unscanned = 在 根 集中 引用 的 对 象 的 集合 ; HSH BM Unreached 中 删除 : 
while (Unscanned £ 0) { 
: ”将 对 象 从 Unscanned 移动 到 Scanned: 
5) -for (在 o 中 引用 的 每 个 对 象 o ) { 


6) if (o' TE Unreached 中 ) ; 
7) Ho! M Unreached 移动 到 Unscarnned 中 : 
} 
} 


8) Free = Free U Unreached; 
9) Unreached = Scanned: 














图 7-25 Baker 的 标记 - 清扫 式 算法 


第 (1) 、(2) 行 将 Scanned 列表 初始 化 为 空 列表 ,并 将 Unscanned 列表 初始 化 为 仅 包 含 那些 可 
以 从 根 集 访 问 的 对 象 。 值 得 注意 的 是 , 这 些 对 象 本 来 都 在 列表 Unreached 中 ,现在 它们 必须 从 该 
列表 中 删除 。 第 (3) 行 到 第 (7) 行 是 一 个 使 用 这 些 列表 的 基本 标记 - 清扫 式 算法 的 简单 实现 。 也 
就 是 说 , 第 (5) 行 到 第 (7) 行 的 for 循环 检查 了 一 个 待 扫描 对 象 。 中 的 所 有 引用 , 如果 这 些 引 用 中 
的 某 一 个 o' 还 没有 被 访问 过 , 则 第 (7) 行 将 0' 改 变 为 待 扫 描 状 态 。 

然后 , 第 (8) 行 处 理 所 有 仍然 在 Unreached 列表 中 的 对 象 , 将 它们 移 到 Free 列表 中 , 从 而 回收 
它们 的 存储 块 。 然 后 , 第 (9) 行 处 理 所 有 处 于 已 扫描 状态 的 对 象 , 即 所 有 的 可 达 对 象 , 并 将 
Unreached 列表 重新 初始 化 , 使 之 恰好 包含 这 些 对 象 。 我 们 假设 ， 当 存储 管理 器 创建 新 对 象 时 , E 
们 同样 会 被 移出 Free 列表 , 加 入 到 Unreached 列表 中 。 m 

在 本 节 介绍 的 两 个 算法 中 , 我 们 都 假设 返回 给 空闲 列表 的 存储 块 仍然 保持 被 回收 前 的 样子 。 
然而 , 如 7.4.4 节 中 讨论 的 , 将 相 邻 的 空闲 块 合并 成 较 大 的 抉 常常 会 带 来 好 处 。 如 果 我 们 想 这 样 
做 , 那么 在 图 7-21 的 第 (10) 行 或 图 7-25 的 第 (8) 行 上 ,每 次 我 们 将 一 个 存储 块 放 人 空闲 列表 时 ， 
我 们 检查 该 块 的 左 端 和 右 端 , 如 果 有 一 端 为 空闲 就 进行 合并 。 

7.6.4 ”标记 并 压缩 的 垃圾 回收 器 

进行 重新 定位 (relocating) 的 垃圾 回收 器 会 在 堆 区 内 移动 可 达 对 象 以 消除 存储 碎片 。 通 常 ， 
可 达 对 象 占 用 的 空间 要 大 大 小 于 空闲 空间 。 因 此 , 在 标记 出 所 有 的 “窗口 "之 后 并 不 一 定 要 逐个 
释放 这 些 空间 , 另 一 个 有 吸引 力 的 做 法 是 将 所 有 可 达 对 象 重新 定位 到 堆 区 的 一 端 , 使 得 堆 区 的 所 
有 空闲 空间 成 为 一 个 块 。 毕 竞 垃圾 回收 器 已 经 分 析 了 可 达 对 象 中 的 每 个 引用 , 因此 更 新 这 些 引 
用 使 之 指向 新 的 存储 位 置 并 不 需要 增加 很 多 工作 量 。 我 们 需要 改变 的 全 部 引用 包括 可 达 对 象 中 
的 引用 和 根 集中 的 引用 。 

将 所 有 可 达 对 象 放 在 一 段 连续 的 位 置 上 可 以 减少 内 存 空间 的 碎片 ,使 得 它 更 容易 存储 较 大 的 对 
象 。 同 时 , 通过 使 数据 占用 更 少 的 缓存 线 和 内 存 页 , 重新 定位 可 以 提高 程序 的 时 间 局 部 性 和 空间 局 
部 性 ,因为 几乎 同时 创建 的 对 象 将 被 分 配 在 相 邻 的 存储 块 中 。 如 果 这 些 相 邻 的 块 中 的 对 象 一 起 使 
M, 那么 就 可 以 从 数据 预 取 中 得 到 好 处 。 不 仅 如 此 , 用 以 维护 空闲 空间 的 数据 结构 也 可 以 得 到 简 
化。 我 们 不 再 需要 一 个 空闲 空间 列表 , 需要 的 只 是 一 个 指向 唯一 空闲 块 的 起 始 位 置 的 指针 .Fee。 
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存在 多 种 进行 重新 定位 的 回收 器 ,其 不 同 之 处 在 于 它们 是 在 本 地 进行 重新 定位 , 还 是 在 重新 


定位 之 前 预 留 了 空间 : 


e 本 节 描 述 的 标记 并 压缩 回收 器 (mark-and-compact collector) 在 本 地 压缩 对 象 。 在 本 地 重新 


定位 可 以 降低 存储 需求 。 
e 7.6.5 节 中 给 
个 区 域 移 到 另 一 
移动 它 。 


一 个 区 域 。 





保留 额外 的 空 


从 出 了 更 高 效 、 更 流行 的 拷贝 回收 器 (copying collector) , 
s 间 用 于 重新 定位 可 以 使 得 


它 把 对 象 从 内 存 的 一 
一 发 现 可 达 对 象 就 立刻 


算法 7.15 中 的 标记 并 压缩 垃圾 同 收 器 有 3 个 阶段 : 


1) 首先 是 标记 阶段 , 它 和 前 面 描 述 


的 标记 - 清扫 式 算法 的 标记 阶段 类 似 。 


2) 在 第 二 阶段 , 算法 扫描 堆 区 中 的 已 分 配 内 存 段 , 并 为 每 个 可 达 对 象 计算 新 的 地 址 。 新 地 


址 从 堆 的 最 低 端 开 始 分 配 , 因此 在 可 达 对 象 之 间 没 有 空 


一 个 名 为 NewLocation 的 结构 中 。 


闲 存 储 窗 口 。 每 个 对 象 的 新 地 址 记录 在 


3) 最 后 , 算法 将 对 象 拷贝 到 它们 的 新 地 址 , 更 新 对 象 中 的 所 有 引用 , 使 之 指向 相应 的 新 地 


ae oe 可 以 在 NewLocation 中 找到 。 





输入 一 个 由 对 象 组 成 的 根 集 ， 

输出 : 指针 .Fee 的 新 值 。 

方法 : 图 7-26 给 出 了 这 个 算法 ,此 算法 
使 用 下 列 的 数据 结构 : 

1) 一 个 Unscanned JIR, 同 算法 7. 12 
中 的 Unscanned 列表 。 

2) 所 有 对 象 的 reached 位 也 和 算法 7.12 
中 相同 。 为 了 使 我 们 的 描述 简单 ， 当 我 们 要 
说 一 个 对 象 的 reached 位 为 1 或 0 时 , 我 们 分 
别称 它们 为 “已 被 访问 的 "或 “未 被 访问 的 ”。 
在 初始 时 刻 , 所 有 的 对 象 都 是 未 被 访问 的 。 

3) 指针 free, 标记 了 堆 区 中 未 分 配 空间 
的 开始 位 置 。 

4) NewLocation 表 。 这 个 结构 可 以 是 任 
意 一 个 实现 了 如 下 两 个 操作 的 散 列 表 、 搜 索 
树 或 其 他 数据 结构 : 

@ 将 NewLocation(o) 设 为 对 象 o 的 新 
地 址 。 

D RENA o, 
的 值 。 

我 们 不 会 关心 到 底 使 用 了 什么 样 的 数据 
结构 ,虽然 你 可 以 假设 NewLocation 是 一 
散 列 表 , 因此 “set” 和 “get” 操 作 所 需要 的 平 
均 时 间 为 某 个 常量 ， 


得 到 NewLocation (o) 


一 个 标记 并 压缩 的 垃圾 回收 器 。 
一 个 堆 , 以 及 一 个 标记 空 


闲 空间 的 起 始 位 置 的 指针 free。 








/+ 标记 s/ 
Unscanned = 根 集 引 用 的 对 象 的 集合 ; 
while (Unscanned # 9) { 
从 Unscanned 中 移 除 对 象 o; 
for (在 o 中 引用 的 每 个 对 象 o ) { 
if (o' 是 未 被 访问 的 ) { 
fio 标记 为 已 被 访问 的 ; 
将 o' 加 入 到 列表 Unscaenned 中 ， 
} 
} 
fe 计算 新 的 位 置 */ 
free = 堆 区 的 开始 位 置 ; 
for (从 低 端 开始 ， 追 历 堆 区 中 的 每 个 存储 块 0){ 
if (o 是 已 被 访问 的 { 
NewLocation(o) = free; 
free = free + sizeof(o); 





} 


} 
/* 重新 设置 引用 目标 并 移动 已 被 访问 的 对 象 */ 
for ( 从 低 端 开始 ， 堆 区 中 的 每 个 存储 块 0) { 
if (o 是 已 被 访问 的 ) { 
for (0 中 的 每 个 引用 o.7 ) 
o.r = NewLocation(o.r); 
44 0 拷贝 到 NewLocation(o) : 




















} 
for ( 根 集 中 的 每 个 引用 7 ) 
r = NewLocation(r); 





图 7-26 一 个 标记 并 压缩 回收 器 


这 个 时 间 和 堆 区 内 的 对 象 数量 无 关 。 
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第 (1) 行 到 第 (7) 行 的 第 一 (或 标记 ) 阶段 在 本 质 上 和 和 算法 7.12 的 第 一 阶段 相同 。 第 二 阶段 
是 从 第 (8 ) 行 到 第 (12) 行 。 该 阶段 从 左边 (或 者 说 从 低地 址 端 ) 开始 访问 堆 中 的 已 分 配 部 分 的 每 
一 个 存储 块 。 结 果 , 被 分 配给 存储 块 的 新 地 址 与 它们 的 老 地 址 按照 同样 的 顺序 增长 。 这 个 顺序 
很 重要 , 它 可 以 保证 我 们 在 重新 定位 对 象 时 总 是 将 对 象 向 左 移 , 那么 在 移动 时 ， 原 来 占据 月 标 空 
间 的 对 象 已 经 被 我 们 移 走 了 。 

第 (8) 行 首先 将 free 指针 设 定 为 指向 堆 区 的 低 端 。 在 这 个 阶段 , 我 们 使 用 free 来 指示 第 -一 个 

可 用 的 新 地 址 。 我 们 只 会 为 标记 为 已 被 访问 的 对 象 。 凶 建新 的 地 址 。 在 第 (10) 行 中 , 对 象 o 被 赋 
予 下 一 个 可 用 地 址 ; 在 第 (11) 行 , 我 们 根据 对 象 o 需要 的 存储 数量 增加 free 指针 ,因此 free 仍然 
R x 间 的 开始 位 置 。 

从 第 (13 ) 行 到 第 (17) 行 是 最 后 阶段 ， 此 时 我 们 再 次 按照 第 二 阶段 中 的 自 左 向 右 的 顺序 访问 
可 达 对 象 。 第 (15$) 、(16 ) 行将 一 个 已 被 访问 到 的 对 象 。 的 所 有 内 部 指针 替换 为 它们 的 新 地 址 ， 
NewLocation 表 用 来 确定 这 个 新 的 地 址 。 然 后 , 第 (17) 行 将 内 部 引用 已 被 更 新 的 对 象 。 移动 到 新 的 
位 置 。 最 后 , 第 (18) 和 (19) 行 重新 确定 根 集 元 素 中 的 指针 指向 的 目标 , 这 些 元 素 本 身 不 是 堆 区 
WA, 它们 可 能 是 静态 分 配对 象 或 栈 分 配对 象 。 图 7-27 说 明了 如 何 将 可 达 对 象 象 ( 图 中 无 阴影 的 对 
象 ) 移 动 到 堆 区 的 底部 , 同时 内 部 指针 被 修改 , 指向 已 被 访问 对 象 的 新 位 置 




















六 


Wi 





























i 
图 7-27 将 已 被 访问 对 象 移动 到 堆 的 前 部 ,同时 保持 内 部 指针 的 指向 关系 
7.6.5 拷贝 回收 器 


拷贝 回收 器 预先 保留 了 可 以 将 对 象 移 人 的 空间 , 因而 解除 了 跟踪 和 发 现 空 闲 空 间 之 间 的 依 
其 关系 。 整 个 存储 空间 被 划分 为 两 个 半空 间 (semispace)A 和 B。 增 变 者 在 半空 间 之 一 ( 比如 A) 
内 分 配 内 存 , 直到 它 被 填 满 。 此 时 增 变 者 停止 , 垃圾 回收 器 将 可 达 对 象 拷贝 到 另 一 个 半空 间 ， 比 
如 说 B。 当 垃圾 回收 完成 时 , 两 个 半空 间 的 角色 进行 对 换 。 增 变 者 可 以 继续 运行 , 并 在 半空 间 B 
中 分 配对 象 。 下 一 轮 垃圾 回收 将 把 可 达 对 象 移动 到 A。 下面 的 算法 是 由 C. J Cheney 提出 的 。 
Cheney 的 拷贝 回收 器 。 

输入 : 一 个 由 对 象 组 成 的 根 集 , 一 个 包含 了 From 半空 间 和 To 半空 间 的 堆 区 , 其 中 From 半空 
间 包 含 了 已 分 配对 象 ，7o 半空 ae ai 

输出 : 最 后 ,To 半空 间 保存 已 分 配 的 对 象 。jree 指针 指明 了 To 半空 间 中 剩余 空闲 空间 的 开 
始 位 置 。 From 半空 间 此 时 全 部 空 闲 。 

方法 : 图 7-28 显示 了 这 个 算法 。Cheney 算法 在 From 半空 间 中 找 出 可 达 对 象 ， 并 且 访 问 到 它 
们 时 立刻 把 它们 拷贝 到 To 半空 间 。 这 种 放置 方法 将 相关 对 象 放 在 一 起 , 从 而 提高 空间 局 部 性 。 

在 探讨 算法 本 身 ( 即 图 7-28 中 的 函数 CopyingCollector) 之 前 , 首先 考虑 第 (11 ) 行 到 第 (16) 行 
的 辅助 函数 LookupNewLocation。 该 函数 的 输入 是 一 个 对 象 。, 如 果 o FE To 空间 中 还 没有 对 应 的 位 
置 , 则 为 其 分 配 一 个 To 空间 中 的 新 地 址 。 所 有 新 地 址 都 被 记录 在 一 个 结构 NewLocation 中 , 特殊 
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{A Null 用 来 表示 还 没有 为 o 分 配 空间 弓 。 和 算法 7. 15 — BE, NewLocation 结 梅 的 具体 形式 可 以 变 
化 , 但 是 现在 假设 它 是 一 个 哈 希 表 就 行 了 。 
如 果 我 们 在 第 (12) 行 发 现 。 a anes 那么 在 第 (13 ) 行 上 它 将 被 赋予 To 半空 间 中 空闲 
空间 的 开始 位 置 。 第 (14) 行 使 free 指针 增加 。 所 占 的 空间 数量 。 在 第 (15) 行 , 我 们 将 o 从 From 
空间 拷贝 到 To 空间 。 因 此 ， 对 象 从 一 个 半空 间 到 另 - 一 个 半空 间 的 移动 K 际 上 是 一 个 函数 的 副 作 
用 。 这 个 副作用 发 生 在 我 们 第 一 次 为 这 个 对 象 寻找 新 地 址 的 时 候 。 不 管 之 前 有 没有 设 定 对 象 o 
的 位 置 , 第 (16) 行 返回 o 在 To 空间 中 的 位 置 。 





1) CopyingCollector () { 

2 for (From 空间 中 的 所 有 对 象 6) NewLocation(o) =NULL; 
3 unscanned = free = To 空间 的 开始 地 址 ; 

4 for ( 根 集中 的 每 个 引用 7 ) 

5 1 rih LookupNewLocations(r); 

6 while (unscanned # free) { 

7 o 二 在 wnscanned 所 指 位 置 上 的 对 象 ; 

8) for (o 中 的 每 个 引用 o-r ) 

9 o.r = LookupNewLocation(o.r); 

0 unscanned = unscanned + sizeof(o); 





请 如 果 一 个 对 象 已 经 被 移动 过 了 ， 查 找 这 个 对 象 的 新 位 置 */ 
fs 否则 将 对 象 设置 为 待 扫描 状态 */ 





11) LookupNewLocation(o) { 
12) if (NewLocatton(o) = NULL) { 
13) NewLocation(o) = free; ` 
14) free = free + sizeof(o); 
15) HHR o 拷贝 到 NewLocation(o); 
16) return NewLocation(o); 
} 








图 7-28 一 个 拷贝 垃圾 回收 器 


现在 我 们 可 以 考虑 这 个 算法 本 身 了 。 第 (2) 行 确保 From 空间 中 的 所 有 对 象 都 还 没有 新 地 址 。 
在 第 (3 ) 行 中 , 我 们 初始 化 两 个 指针 unscanned Fil free, 使 它们 都 指向 To 半空 间 的 开始 位 置 。 指 针 
free 将 总 是 指向 To 半空 间 中 空闲 空间 的 起 始 位 置 。 当 我 们 往 To 空间 加 入 对 象 时 , 那些 地 址 低 于 
unscanned 的 对 象 将 处 于 已 扫描 状态 , 而 那些 位 于 unscanned Fil free 之 间 的 对 象 则 处 于 待 扫 描 状 

。 因 此 , free 总 是 在 unscanned 的 前 面 。 当 后 者 追 上 前 者 时 就 表示 不 存在 更 多 的 待 扫 描 对 象 了 ， 
我 们 就 完成 了 垃圾 回收 工作 。 请 注意 , 我 们 是 在 To 空间 中 完成 垃圾 回收 工作 的 , 尽管 在 第 (8) 行 
中 检查 的 对 象 中 的 所 有 引用 都 是 指向 From 空间 的 。 š 

第 (4) 行 和 第 (5) 行 处 理 可 以 从 根 集 访 问 到 的 对 象 。 请 注意 ,因为 函数 副作用 ， 在 第 (5)1 FP 
对 LookupNewLocation 的 某 些 调用 会 在 To 中 为 这 些 对 象 分 配 存 储 块 ， 同 时 增加 free 指针 的 值 。 因 
此 , 除非 没有 被 根 集 引用 的 对 象 (在 这 种 情况 下 , 整个 堆 区 都 是 垃圾 )， 当 程序 第 一 次 运行 到 这 里 
时 将 进入 第 (6) 行 到 第 (10) 行 的 循环 。 然 后 , 这 个 循环 扫描 所 有 已 经 被 加 入 到 To 空间 中 并 处 于 
待 扫描 状态 的 对 象 。 第 (7) 行 处 理 下 一 个 待 扫 描 的 对 象 。。 在 第 (8)、(9) 行 , 对 于 。o 中 的 每 个 引 
Fl, 从 它 在 From 半空 间 中 的 原 值 被 翻译 为 在 To 半空 间 中 的 值 。 请 注意 , 因为 函数 副作用 , WR 





O 在 一 个 典型 的 数据 结构 中 (如 散 列表 ) , 如 果 o 没有 被 赋予 一 个 位 置 ,那么 在 这 个 结构 中 就 没有 相关 信息 。 
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o 内 的 某 个 引用 所 指向 的 对 象 之 前 还 没有 被 访问 过 , 那么 第 (9) 行 中 对 LookupNewLocation 的 调用 
将 在 To 空间 中 为 这 个 对 象 分 配 空 间 并 将 它 移 到 该 空间 中 。 最 后 , 第 (10) 行 增加 指针 unscanned 
的 值 , 使 之 指向 下 一 个 对 象 , 即 To 空间 中 。 之 后 的 对 象 。 口 
7.6.6 开销 的 比较 

Cheney 算法 的 优势 在 于 它 不 会 涉及 任何 不 可 达 对 象 。 另 一 方面 , 拷贝 垃圾 回收 器 必须 移动 
所 有 可 达 对 象 的 内 容 。 对 于 大 型 对 象 , 或 者 那些 经 历 了 多 轮 垃圾 收集 过 程 的 生命 周期 长 的 对 象 
HE, 这 个 过 程 的 开销 特别 高 。 我 们 对 本 节 给 出 的 四 种 算法 的 运行 时 间 进 行 总 结 。 下 面 的 每 个 
估算 都 忽略 了 处 理 根 集 的 开销 。 ， 

o 基本 的 标记 - 清扫 式 算法 (算法 7.12) : 与 堆 区 中 存储 块 的 数目 成 正比 。 

e Baker 的 标记 - 清扫 式 算 法 (算法 7. 14) : 与 可 达 对 象 的 数目 成 正比 。 

e 基本 的 标记 并 压缩 算法 (算法 7.15): 与 堆 区 中 存储 块 的 数目 和 可 达 对 象 的 总 大 小 成 

正比 。 

e Cheney 的 拷贝 回收 器 (算法 7. 16) : 与 可 达 对 象 的 总 大 小 成 正比 。 
7.6.7 7.6 节 的 练习 

练习 7. 6. 1: 当下 列 事件 发 生 时 , 给 出 标记 - 清扫 式 垃圾 回收 器 的 处 理 步骤 。 

1) 图 7-19 中 指针 AB 被 删除 。 

2) 图 7-19 中 指针 4 一 C 被 删除 。 

3) 图 7-20 中 指针 AD 被 删除 。 

人 

练习 7. 6. 2: Baker 的 标记 - 清扫 式 算 法 在 四 个 列表 Free, Unreached, Unscanned 和 Scanned 之 
间 移 动 对 象 。 对 于 练习 7. 6. 1 中 的 每 个 对 象 网 络 中 的 每 个 对 象 , 指出 从 垃圾 回收 过 程 刚 iam 到 该 
过 程 刚 结束 的 时 间 段 内 , 该 对 象 所 经 历 的 列表 的 序列 。 

练习 7. 6. 3: 假设 我 们 在 练习 7.6.1 中 的 各 个 网 络 上 执行 了 一 个 标记 并 压缩 垃圾 回收 过 
同时 假设 

1) 每 个 对 象 的 大 小 是 100 个 字 节 。 

2) 在 开始 时 刻 , 堆 区 中 的 9 个 对 象 按照 字母 顺序 从 堆 区 的 第 0 个 字 节 开始 排列 。 

在 垃圾 回收 过 程 结 束 之 后 , 各 个 对 象 的 地 址 是 什么 ? 

练习 7. 6.4: 假设 我 们 在 练习 7.6.1 中 的 各 个 网 络 上 执行 了 Cheney 的 拷贝 垃圾 回收 算法 。 
同时 假设 

1) 每 个 对 象 的 大 小 为 100 字 节 。 

2) 待 扫 描 的 列表 按照 队列 的 方式 进行 管理 , 并 且 当 一 个 对 象 具有 多 个 指针 时 , 被 访问 到 的 
对 象 按照 字母 顺序 被 加 入 到 队列 中 。 

3) From 半空 间 从 位 置 0 开始 ，7o 半空 间 从 位 置 10 000 开始 。 

在 垃圾 回收 完成 之 后 , 每 个 保留 下 来 的 对 象 。 的 NewLocation( 0) 的 值 是 什么 ? 


7.7 短 停 顿 垃圾 回收 


简单 的 基于 跟踪 的 回收 器 是 以 全 面 停顿 的 方式 进行 垃圾 回收 的 , 它 可 能 造成 用 户 程序 的 运 
行 的 长 时 间 的 停顿 。 我 们 可 以 每 次 只 做 部 分 垃圾 回收 工作 , 从 而 减少 一 次 停顿 的 长 度 。 我 们 可 
以 按照 时 间 来 分 割 工作 任务 , 使 垃圾 回收 和 增 变 者 的 运行 交错 进行 。 我 们 也 可 以 按照 空间 来 分 
割 工 作 任务 , 每 次 只 完成 一 部 分 垃圾 的 回收 。 前 者 称 为 增 量 式 回 收 (incremental collection), 后 者 
称 为 部 分 回收 (partial collection) 。 
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增 量 式 回 收 器 将 可 达 性 分 析 任务 分 割 成 为 若干 个 较 小 单元 ,并 允许 增 变 者 和 这 些 任 务 单元 
交错 运行 。 可 达 集 合 会 随 着 增 变 者 的 运行 发 生变 化 , 因此 增 量 式 回 收 是 很 复杂 的 。 我 们 将 在 
7.7.1 节 看 到 , 寻找 一 个 稍微 保守 的 解决 方法 将 使 得 跟踪 更 加 高 效 。 

最 有 名 的 部 分 回收 算法 是 世代 垃圾 回收 (generational garbage collection ) 。 它 根据 对 象 已 分 配 
时 间 的 长 短 来 划分 对 象 , 并 且 较 频繁 地 回收 新 创建 的 对 象 , 因为 这 些 对 象 的 生命 周期 往往 较 短 。 
另 一 种 可 选 的 算法 是 列车 算法 (train algorithm) , 也 是 每 次 只 回收 一 部 分 垃圾 。 它 最 适合 回收 较 成 
熟 的 对 象 。 这 两 个 算法 可 以 联合 使 用 , 构成 一 个 部 分 回收 器 。 这 个 回收 器 使 用 不 同 的 方法 来 处 
理 较 新 的 和 较 成 熟 的 对 象 。 我 们 将 在 7.7. 3 节 讨 论 有 关 部 分 回收 的 基本 算法 , 然后 详细 地 描述 世 
代 算 法 和 列车 算法 的 工作 原理 。 

来 自 于 增 量 回收 算法 和 部 分 回收 算法 的 思想 经 过 修改 ,可 以 用 于 构造 一 个 在 多 处 理 需 系统 
中 并 行 回 收 对 象 的 算法 ， 见 7.8.1 节 。 

7.7.1 增 量 式 垃圾 回收 

增 量 式 回收 器 是 保守 的 。 虽 然 垃圾 回收 器 一 定 不 能 回收 不 是 垃圾 的 对 象 , 但 是 它 并 不 一 定 
要 在 每 一 轮 中 辐 收 所 有 的 垃圾 。 我 们 将 每 次 回收 之 后 留 下 的 垃圾 称 为 漂浮 垃圾 (floating gar- 
bage) 。 我 们 当然 期 望 漂 肖 垃圾 越 少 越 好 。 明 确 地 说 , 增 量 式 回收 器 不 应 该 遗漏 那些 在 回收 周期 
开始 时 就 已 经 不 可 达 的 垃圾 。 如 果 我 们 能 够 保证 做 到 这 一 点 , 那么 在 某 一 轮 中 没有 被 回收 的 垃 
摇 一 定 会 在 下 一 轮 中 被 回收 。 因 此 不 会 因为 这 个 垃圾 回收 方法 而 产生 内 存 泄漏 问题 。 

换 句 话说 , 增 量 式 垃 圾 回收 器 会 过 多 地 估算 可 达 对 象 集合 ,从 而 保证 安全 性 。 它 们 首先 以 不 
可 中 断 的 方式 处 理 程序 的 根 集 ,此 时 没有 来 自 增 变 者 的 干扰 。 在 找到 了 待 扫描 对 象 的 初始 集合 
之 后 , 增 变 者 的 动作 与 跟踪 步骤 交错 进行 。 在 这 个 阶段 , 任何 可 能 改变 可 达 性 的 增 变 者 动作 都 被 
简洁 地 记录 在 一 个 副 表 中 , 使 得 回收 器 可 以 在 继续 执行 时 做 出 必要 的 调整 。 如 果 在 跟踪 完成 之 
前 空间 就 被 耗 尽 , 那么 回收 器 将 不 再 允许 增 变 者 执行 ,并 完成 全 部 跟踪 过 程 。 在 任何 情况 下 , 当 
跟踪 完成 后 , 空间 回收 以 原 语 的 方式 完成 。 

增 量 回收 的 准确 性 

一 旦 对 象 成 为 不 可 达 的 , 该 对 象 就 不 可 能 再 变 成 可 达 的 。 因 此 , 在 垃圾 回收 和 增 变 者 运行 
AY, 可 达 对 象 的 集合 只 可 能 : 

1) 因为 垃圾 回收 开始 之 后 的 某 个 新 对 象 的 分 配 而 增长 。 

2) 因为 失去 了 指向 已 分 配对 象 的 引用 而 缩小 。 

令 垃 圾 回收 开始 时 的 可 达 对 象 集合 为 S New 表示 在 垃圾 回收 期 间 创 建 并 分 配 的 对 象 集 
合 , 并 令 Lost 表示 在 跟踪 开始 之 后 因为 引用 丢失 而 变 得 不 可 达 的 对 象 的 集合 。 那 么 当 跟 踪 完 
之 后 , 可 达 对 象 的 集合 为 : 

(R UNew) - Lost 

如 果 在 每 次 增 变 者 丢失 了 一 个 指向 某 个 对 象 的 引用 之 后 都 重新 确定 该 对 象 的 可 达 性 , 那么 
开销 会 变 得 很 大 ,因此 增 量 式 回 收费 并 不 试图 在 跟踪 结束 时 回收 所 有 的 垃圾 。 任 何 遗 留 下 的 垃 
圾 一 一 漂浮 垃圾 一 一 应 该 是 Lost 对 象 的 一 个 子 集 。 如 果 形 式 化 地 描述 , 那 通过 跟踪 找到 的 对 象 
集合 $ 必须 满足 





(R UNew) - Lost CS © (R UNew) 

简单 的 增 量 式 跟 踪 
我 们 首先 描述 一 种 用 来 找到 集合 R U New 的 上 界 的 简单 跟踪 算法 。 在 跟踪 期 间 ， weet 
行为 更 改 如 下 : : 
。 在 垃圾 回收 开始 之 前 已 经 存在 的 所 有 引用 都 被 保留 。 也 就 是 说 ,在 增 变 者 覆 写 一 个 引用 ” 
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之 前 , 它 原来 的 值 被 记 住 , 并 被 当 作 一 个 只 包含 这 个 引用 的 附加 待 扫描 对 象 。 

© 所 有 新 创建 的 对 象 立即 就 被 认为 是 可 达 的 , 并 被 放置 在 待 扫 描 状 态 中 。 

这 种 方案 是 保守 且 正 确 的 ， 因为 它 找 出 了 RR 和 New。R 是 在 垃圾 回收 之 前 可 达 的 所 有 对 象 的 
we, New 是 所 有 新 分 配 的 对 象 的 集合 。 然 而 , 这 种 方案 付出 的 代价 也 很 高 , 因为 算法 需要 拦截 
所 有 的 写 运 算 , 并 记 住所 有 被 覆 写 的 引用 。 这 些 工作 中 的 一 部 分 是 不 必要 的 ， 因为 它 涉及 的 对 象 
在 垃圾 回收 结束 时 可 能 已 经 是 不 可 达 的 。 如 果 我 们 能 够 探测 到 哪些 被 覆 写 的 引用 所 指 的 对 象 在 
本 轮 垃圾 回收 结束 时 不 可 达 , 我 们 就 可 以 避免 这 部 分 工作 , 同时 还 可 以 提高 算法 的 准确 性 。 下 一 
个 算法 在 这 两 个 方面 都 做 了 很 好 的 改进 。 

7.7.2 增 量 式 可 达 性 分 析 

如 果 我 们 让 增 变 者 和 一 个 像 算法 7. 12 那样 的 基本 跟踪 算法 交替 执行 , 那么 一 些 可 达 对 象 可 
能 会 被 错 认为 是 不 可 达 的 。 问 题 的 根源 在 于 增 变 者 的 动作 可 能 会 违反 这 个 算法 的 一 个 关键 不 变 
st, 即 一 个 已 扫描 对 象 中 的 引用 只 能 指向 已 扫描 或 待 扫描 的 对 象 , 这 些 引 用 不 可 以 指向 未 被 访问 
对 象 。 考 虑 下 面 的 场景 : 

1) 垃圾 回收 器 发 现 对 象 of 可 达 并 扫描 ol 中 的 指针 ,因而 将 ol 置 于 已 扫描 状态 。 

2) 增 变 者 将 一 个 指向 未 被 访问 (但 可 达 ) 的 对 象 。 的 引用 存放 到 已 扫描 对 和 象 o 中 。. 它 从 当 
前 处 于 未 被 访问 或 待 扫 描 状 态 的 对 象 o, 中 将 一 个 指向 。 的 引用 拷贝 到 ol 中 。 

3) 增 变 者 失去 了 对 象 o 中 指向 o 的 引用 。 它 可 能 已 经 在 扫描 o 中 指向 o 的 引用 之 前 就 窗 
写 了 这 个 指针 ; 也 可 能 0, 已 经 变 得 不 可 达 , 因此 一 直 没 有 进入 待 扫 描 状 态 , 因此 它 内 部 的 指针 没 
有 被 扫描 过 。 

现在 , o 可 以 通过 对 象 o Bik, 但 是 垃圾 回收 器 可 能 既 没 有 看 到 o1 中 指向 o 的 引用 , 也 没有 
看 到 o 中 指向 o 的 引用 。 

要 得 到 一 个 更 加 准确 且 正 确 的 增 量 式 跟踪 方法 , 关键 在 于 我 们 必须 注意 所 有 将 一 个 指向 当 
前 未 被 访问 对 象 的 引用 从 一 个 尚未 扫描 的 对 象 中 拷贝 到 已 扫描 对 象 中 的 动作 。 为 了 截获 可 能 有 
问题 的 引用 传递 , 算法 可 以 在 跟踪 过 程 中 按照 下 列 方式 修改 增 变 者 的 动作 : 

e 写 关 卡 。 截 获 把 一 个 指向 未 被 访问 的 对 象 o 的 引用 写 人 一 个 已 扫描 对 象 o| 的 运算 。 在 这 

种 情况 下 , 将 。 作 为 可 达 对 象 并 将 其 放 人 待 扫描 集合 。 另 一 种 方法 是 将 被 写 对 象 o 放 回 
到 待 扫描 集合 中 , 使 得 我 们 可 以 再 次 扫描 它 。 

o 读 关卡 。 截 获 对 未 被 访问 或 待 扫 描 对 象 中 的 引用 的 读 运 算 。 只 要 增 变 者 从 一 个 处 于 未 被 
访问 或 待 扫描 状态 中 的 对 象 读 取 一 个 指向 对 象 。 的 引用 时 , 就 将 。 设 为 可 达 的 , 并 将 其 放 
人 待 扫描 对 象 的 集合 。 

e 传递 关卡 。 和 截获 在 未 被 访问 或 待 扫描 对 象 中 原 引 用 丢失 的 情况 。 只 要 增 变 者 覆 写 一 个 未 
被 访问 或 待 扫描 对 象 中 的 引用 时 ,保存 即将 被 履 写 的 引用 并 将 其 设 为 可 达 的 ,然后 将 这 
个 引用 本 身 放 人 待 扫描 集合 。 

上 述 几 种 做 法 都 不 能 找到 最 小 的 可 达 对 象 集合 。 如 果 跟 踪 过 程 确 定 一 个 对 象 是 可 达 的 , BB 
么 这 个 对 象 就 一 直 被 认为 是 可 达 的 。 即 使 在 跟踪 过 程 结束 之 前 所 有 指向 它 的 引用 都 被 覆 写 , È 
仍然 被 认为 是 可 达 的 。 也 就 是 说 , 找到 的 可 达 对 象 集合 介 于 (RU Mw) - Lost G(R UNew) 之 间 。 

上 面 给 出 的 可 选 算法 中 写 关卡 方法 是 最 有 效 的 。 读 关卡 方法 的 代价 较 高 ， 因 为 一 般 来 说 读 
运算 要 比 写 运 算 多 得 多 。 转 换 关卡 没有 什么 竞争 力 ， 因 为 很 多 对 象 “ 英 年 旱 逝 ”, 这 种 方法 会 保 
留 很 多 的 不 可 达 对 象 。 

写 关 卡 的 实现 

我 们 可 以 用 两 种 方式 来 实现 写 关 卡 。 第 一 种 方式 是 在 增 变 阶段 记录 下 所 有 被 写 人 到 已 扫描 
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对 象 中 的 新 引用 。 我 们 可 以 将 这 些 引用 放 人 一 个 列表 。 如 果 不 考 虑 从 列表 中 剔除 重复 引用 , 列表 
的 大 小 和 对 已 扫描 对 象 的 写 运算 的 数量 成 正比 。 注 意 , 列表 中 的 引用 本 身 可 能 在 后 来 又 被 覆 写 
掉 ， 因 此 可 能 被 忽略 。 
第 二 种 ， 也 是 更 有 效 的 方式 是 记 住 写 运 算 发 生 的 位 置 。 我 们 可 以 用 被 写 位 置 的 列表 来 记录 它 
们 ， 基 中 可 能 会 消除 重复 的 位 置 。 请 注意 ,只 要 所 有 被 写 的 位 置 都 被 重新 扫描 , 那么 是 否 精 确 记 录 
写 的 位 置 并 不 重要 。 因 此 , 有 多 种 技术 支持 我 们 记录 较 少 的 有 关 被 覆 写 的 确切 位 置 的 细节 。 
e 我 们 可 以 只 记录 包含 了 被 写字 段 的 对 象 ， 而 不 需要 记录 被 写 的 精确 地 址 或 者 被 写 的 对 象 
及 字段 。 
。 我 们 可 以 将 地 址 空间 分 成 固定 大 小 的 块 ， 这 些 块 被 称 为 卡片 (card ) , 并 使 用 一 个 位 数组 来 
记录 曾经 被 写 入 的 卡片 。 | 
e 我 们 可 以 选择 记录 下 包含 了 被 写 位 置 的 页 。 我 们 可 以 只 将 那些 包含 了 已 扫描 对 象 的 页 置 
为 被 保护 状态 。 那 么 , 不 需 执行 任何 显 式 的 指令 就 可 以 检测 到 任何 对 已 扫描 对 象 的 写 运 
算 。 因 为 这 样 的 写 运算 会 引发 一 个 保护 错误 , 操作 系统 将 引发 一 个 程序 异常 
一 般 来 说 , 通过 增 大 被 覆 写 位 置 的 记录 粒度 就 可 以 减少 所 需 的 存储 空间 , 但 代价 是 增加 了 和 需 
要 再 次 执行 的 扫描 工作 量 。 在 第 一 种 方案 中 , 无 论 实际 上 修改 了 被 修改 对 象 中 的 哪个 引用 ,该 对 
象 中 的 所 有 引用 都 要 进行 重新 扫描 。 在 后 两 种 方案 中 , 在 被 修改 的 卡片 或 页 中 的 所 有 可 达 对 象 
都 要 在 跟踪 过 程 的 最 后 进行 重新 扫描 。 
结合 增 量 和 拷贝 技术 
上 述 的 方法 对 于 标记 - 清扫 式 垃圾 回收 来 说 已 经 足够 了 。 因 为 拷贝 回收 和 增 变 者 的 相互 影 
I, 它 的 实现 要 稍微 复杂 一 点 。 处 于 已 扫描 或 待 扫描 状态 中 的 对 象 有 两 个 地 址 ，-- 个 位 于 From 
半空 间 , 另 一 个 位 于 To 半空 间 。 和 算法 7. 16 一样 , 我 们 必须 保存 一 个 从 对 象 的 旧地 址 到 其 重新 
定位 之 后 的 地 址 的 映射 。 
我 们 可 以 选择 两 种 更 新 引用 的 方法 。 第 一 种 方法 是 ， 我 们 可 以 让 增 变 者 在 Prom 空间 中 完成 
所 有 的 运算 ， 只 是 在 垃圾 回收 结束 的 时 候 才 更 新 所 有 的 指针 , 并 将 所 有 的 内 容 都 拷贝 到 To 空间 。 
第 二 种 方法 是 , 我 们 可 以 让 程序 直接 改变 To 空间 中 的 表示 。 当 增 变 者 对 一 个 指向 From 空间 的 指 
针 解 引用 时 ， 如 果 在 To 空间 中 存在 对 应 于 该 指针 的 新 位 置 ,那么 这 个 指针 就 被 翻译 成 这 个 新 位 
置 。 所 有 这 些 指 针 在 最 后 都 需要 被 转换 成 指向 To 空间 的 新 位 置 。 
7.7.3 部 分 回收 概述 
一 个 基本 的 事实 是 , 对象 通常 * 英 年 早 逝 ”。 人 们 发 现 , 通常 80% ~98% 的 新 分 配对 象 在 几 
百 万 条 指令 之 内 , 或 者 在 再 分 配 了 另外 的 几 兆 字 节 之 前 就 消亡 了 。 也 就 是 说 , 对 象 通常 在 垃圾 回 
收 过 程 启动 之 前 就 已 经 变 得 不 可 达 了 。 因 此 , 频繁 地 对 新 对 象 进行 垃圾 具有 相当 高 的 性 价 比 。 
然而 , 经 历 了 一 次 回收 的 对 象 很 可 能 在 多 次 回收 之 后 依然 存在 。 在 迄今 为 止 描述 的 垃圾 回 
收 器 中 ,同一 个 成 熟 对 象 会 在 各 轮 坛 圾 回收 中 被 发 现 是 可 达 的 。 如 果 使 用 揽 贝 回收 器 , 这 些 对 和 象 
会 在 各 轮 垃圾 回收 中 被 一 次 次 地 拷贝 。 世 代 回 收 在 包含 最 年 轻 对 象 的 堆 区 域 中 的 回收 工作 最 为 
WE, 所 以 它 通 常 可 以 用 相对 较 少 的 工作 量 回收 大 量 的 垃圾 。 另 一 方面 , 列车 算法 没有 在 年 轻 对 
象 上 花费 太 多 的 时 间 , 但 是 它 能 够 有 效 限制 因 垃 圾 回收 而 造成 的 程序 停顿 时 间 。 因 此 , 将 这 两 个 
策略 合并 的 好 方法 是 对 年 轻 对 象 使 用 世代 回收 , 而 一 旦 一 个 对 象 变 得 相当 成 熟 , 则 将 它 “ 提 升 ” 
到 一 个 由 列车 算法 管理 的 独立 堆 区 中 。 
我 们 把 将 在 一 轮 部 分 回收 中 被 回收 的 对 象 集合 称 为 目标 (targel) 集 ， 而 将 其 他 对 象 称 为 稳定 
(stable) 集 。 在 理想 状态 下 , 一 个 部 分 回收 器 应 该 回收 目标 集中 所 有 无 法 从 根 集 到 达 的 对 象 。 然 
而 , 这 人 么 做 需要 跟踪 所 有 的 对 象 ， 而 这 正 是 我 们 首先 要 试图 避免 的 事情 。 实 际 上 , 部 分 回收 器 只 
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是 保守 地 回收 那些 无 法 从 根 集 和 稳定 集 到 达 的 对 象 。 因 为 稳定 集中 的 一 些 对 象 自身 也 是 不 可 达 
AY, 我 们 可 能 会 把 目标 集中 一 些 实际 上 不 存在 从 根 集 开 始 的 路 径 的 对 象 当 成 可 达 对 象 。 

我 们 可 以 修改 7. 6.1 节 和 7.6.4 节 中 描述 的 垃圾 回收 器 ,改变 “ 根 集 ” 的 定义 , 使 之 以 部 分 回 
收 的 方式 工作 。 现 在 根 集 指 的 不 仅 是 存放 在 寄存 器 、 栈 和 全 局 变量 中 的 对 象 , 它 还 包括 所 有 指向 
目标 集 对 象 的 稳定 集中 的 对 象 。 从 一 个 目标 对 象 指向 其 他 目标 对 象 的 引用 按照 以 前 的 方法 进行 
跟踪 , 以 找到 所 有 的 可 达 对 象 。 我 们 可 以 忽略 所 有 指向 稳定 对 象 的 指针 ， 因为 在 本 轮 部 分 回收 中 
这 些 对 象 被 认为 是 可 达 的 。 

为 了 找 出 那些 引用 了 目标 对 象 的 稳定 对 象 , 我 们 可 以 采用 和 增 量 垃 圾 回收 所 用 技术 类 似 的 
方法 。 在 增 晤 回收 中 , 我 们 和 需要 在 跟踪 过 程 中 记录 所 有 对 从 已 扫描 对 象 到 未 被 访问 对 象 的 引用 
的 写 运 算 。 在 这 里 ,我 们 需要 记录 下 增 变 者 的 整个 运行 过 程 中 对 从 稳定 对 象 到 目标 对 象 的 引用 
的 写 运 算 。 只 要 增 变 者 将 一 个 指向 某 个 目标 对 象 的 引用 保存 到 稳定 对 象 中 时 , 我 们 要 么 记录 下 
这 个 引用 , 要 么 记录 下 写 人 的 位 置 。 我 们 把 保存 了 从 稳定 对 象 到 目标 对 象 的 引用 的 对 和 象 集合 称 
为 被 记忆 集合 (remembered set) 。 如 7.7.2 节 中 讨论 的 , 我 们 可 以 只 记录 下 包含 了 被 写 人 对 象 所 
在 的 卡片 或 页 , 以 压缩 被 记忆 集合 的 表示 。 

部 分 垃圾 回收 器 通常 被 实现 为 拷贝 垃圾 回收 器 。 通 过 使 用 链表 来 跟踪 可 达 对 象 , 也 可 以 实 
现成 为 非 拷 贝 回收 器 。 下 面 描述 的 “世代 "方案 是 一 个 关于 如 何 将 拷贝 和 部 分 回收 相 结合 的 例子 。 
7.7.4 世代 垃圾 回收 

世代 垃圾 回收 (generational garhage collection) 是 一 种 充分 利用 了 大 多 数 对 象 " 英 年 早 逝 ”的 特 
性 的 有 效 方法 。 在 世代 垃圾 回收 中 , 堆 区 被 分 成 一 系列 小 的 区 域 。 我 们 将 用 0, 1, 2,…, n 对 它 
们 进行 编号 , 序号 越 小 的 区 域 存放 的 对 象 越 年 轻 。 对 象 首先 在 0 区 域 被 创建 。 当 这 个 区 域 被 填 满 
At, 它 的 垃圾 被 回收 , 且 其 中 的 可 达 对 象 被 移 到 1 区 。 现 在 , 0 区 又 成 为 空 的 , 我 们 继续 把 新 对 
象 分 配 到 这 个 区 域 。 当 0 区 再 次 被 填 满 9, 它 的 垃圾 又 被 回收 , 且 它 的 可 达 对 象 被 拷贝 到 1 区 ， 
与 之 前 被 拷贝 的 对 象 合 在 一 起 。 这 个 模式 一 直 被 重复 , 直到 1 区 也 被 填 满 为 止 。 此 时 应 对 0 区 和 
1 区 应 用 垃圾 回收 。 

一 般 来 说 , 每 一 轮 坪 圾 回收 都 是 针对 序号 小 于 等 于 某 个 i 的 区 域 进行 的 , 应 该 将 i 选择 为 当 
前 被 填 满 区 域 的 最 高 编号 。 每 当 一 个 对 象 经 历 了 一 轮回 收 ( 即 它 被 确定 为 可 达 的 )， 它 就 从 它 当 
前 所 在 区 域 被 提升 到 下 一 个 较 高 的 区 域 , 直到 它 到 达 最 老 的 区 域 , PSA n AKR, 

使 用 7.7. 3 节 中 介绍 的 术语 ， 当 区 域 i 及 更 低 区 域 中 的 垃圾 被 回收 时 , 从 0 到 ;的 区 域 组 成 
TER, 所 有 序号 大 于 i 的 区 域 组 成 了 稳定 集 。 为 了 为 各 种 可 能 的 部 分 回收 找到 根 集 , 我 们 为 
每 个 区 域 i 保持 了 一 个 被 记忆 集 , 该 集合 由 指向 区 域 i 中 对 象 且 位 于 大 于 i 的 区 域 中 的 所 有 对 象 
组 成 。 在 i 上 激活 的 一 次 部 分 回收 的 根 集 包括 了 区 域 i 及 更 低 区 域 的 被 记忆 和 集 。 

在 这 个 方案 中 ,只 要 我 们 对 i 进行 回收 ,所 有 序号 小 于 i 的 区 域 也 将 进行 垃圾 回收 。 有 两 个 
原因 促使 我 们 采用 这 个 策略 ; 

1) 因为 较 年 轻 的 世代 往往 包含 较 多 的 垃圾 , 也 就 更 频繁 地 被 回收 。 所 以 , 我 们 可 以 将 它们 
和 和 较 老 的 世代 一 起 回收 。 

2) 根据 这 种 策略 , 我 们 只 和 需要 记录 从 较 老 世代 指向 较 新 世代 的 引用 。 也 就 是 说 , 对 最 年 轻 
世代 的 对 象 进行 写 运 算 , 以 及 将 对 象 提升 到 下 一 世代 时 都 不 需要 更 新 任何 被 记忆 集 。 如 果 我 们 












































O 从 技术 上 来 说 , 区 域 不 会 被 填 满 , 因为 如 果 需 要 ,存储 管理 器 可 以 使 用 附加 的 磁盘 块 对 它们 进行 扩展 。 然 而 ， 除 
了 最 后 一 个 区 域 , 其 他 区 域 的 尺寸 通常 都 有 一 个 界限 。 我 们 将 把 到 达 这 一 界限 称 为 ^ 填 满 ”。 
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对 某 个 区 域 进行 回收 , 但 是 不 回收 某 个 较 年 轻 的 世代 , 那么 后 者 将 成 为 稳定 集 的 一 部 分 。 我 们 将 
不 得 不 同时 记录 从 较 年 轻 世 代 指 向 较 年 老 世 代 的 引用 。 

总 而 言 之 , 这 种 方案 更 频繁 地 回收 较 年 轻 的 世代 , 并 且 因 为 "对象 英 年 早 逝 ”,， 对 于 这 些 世 代 
进行 垃圾 回收 的 效 费 比特 别 高 。 对 较 老 世代 的 垃圾 回收 则 要 花 更 多 的 时 间 , 因为 它 包括 了 对 所 
有 较 年 轻 世 代 的 回收 , 同时 它们 包含 的 垃圾 也 相应 减少 。 虽然 如 此 , 较 老 世代 还 是 需要 每 过 一 段 
时 间 进 行 一 次 回收 ,以 期 除 不 可 达 对 象 。 最 老 的 世代 保存 了 最 成 熟 的 对 象 ， 对 这 些 对 象 的 回收 是 
最 昂贵 的 ,因为 它 相 当 于 一 次 完整 的 回收 。 也 就 是 说 ,世代 回收 器 偶尔 也 需要 执行 完整 的 跟踪 步 
又 ,因此 也 会 在 程序 运行 时 引 人 较 长 时 间 的 停顿 。 接 下 来 将 讨论 另 一 种 只 处 理 成 熟 对 象 的 方法 。 
7.7.5 列车 算法 

尽管 世代 方法 在 处 理 年 轻 对 象 时 非常 高 效 , 但 它 在 处 理 成 熟 对 象 时 却 相 对 低 效 ,因为 每 当 一 
个 垃圾 回收 过 程 涉及 某 个 成 熟 对 象 时 ,该 对 象 都 会 被 移动 , 而且 它们 不 太 可 能 变 成 垃圾 。 另 一 种 
被 称 为 列车 算法 的 增 量 式 回收 方法 用 于 改进 对 成 熟 对 象 的 处 理 。 它 可 以 用 来 回收 所 有 的 垃圾 。 
但 是 更 好 的 方法 是 使 用 世代 方法 来 处 理 年 轻 的 对 象 , 只 有 当 这 些 对 象 经 历 了 几 轮 世代 回收 之 后 
仍然 存在 , 才 将 它们 提升 到 另 一 个 由 列车 算法 管理 的 堆 区 。 列 车 算法 的 另 一 个 优点 是 我 们 永远 
不 需要 进行 全 面 的 垃圾 回收 过 程 , 而 在 世代 垃圾 回收 中 却 仍然 必须 偶尔 那样 做 。 

为 了 描述 列车 算法 的 动机 , 我 们 首先 看 一 个 简单 的 例子 。 该 例子 告诉 我 们 为 什么 在 世代 方法 中 
必须 偶尔 进行 一 轮 全 面 的 垃圾 回收 。 图 7-29 给 出 了 位 于 两 个 区 域 i 和 j 中 的 两 个 相互 连接 的 对 象 ， 
其 中 > i。 因 为 这 两 个 对 象 都 有 来 自 其 区 域 之 外 的 指针 , 只 对 区 域 ;或 只 对 区 域 ) 进行 回收 都 不 能 回 
收 这 两 个 对 象 。 然 而 , 它们 可 能 实际 上 是 一 个 循环 垃圾 结构 中 的 一 部 分 , 没有 外 部 链接 指向 该 垃圾 
结构 。 一 般 来 说 , 这 里 显示 的 对 象 之 间 的 “链接 "可 能 涉及 很 多 对 象 和 一 条 很 长 的 引用 链 。 


mk i i 下 区 域 了 


图 7-29 一 个 跨越 区 域 的 可 能 是 循环 垃圾 的 环 状 结构 


在 世代 垃圾 回收 中 , 我 们 最 终 会 回收 区 域 j, 并 且 因 为 i<j, 我 们 同时 还 会 回收 i 区 域 。 那 么 
这 个 循环 结构 将 被 完全 包含 在 正在 被 回收 的 堆 区 中 , 我 们 就 可 以 确定 它 是 否 真 的 是 垃圾 。 然 而 ， 
如 果 我 们 从 没有 进行 过 一 轮 包 括 了 i 和 j 的 回收 , 那么 我 们 就 会 碰 到 循环 垃圾 的 问题 , 也 就 是 我 
们 在 使 用 引用 计数 进行 垃圾 回收 时 碰 到 的 问题 。 

列车 算法 使 用 固定 大 小 的 被 称 为 车 帮 ( car) 的 区 域 。 当 没有 对 象 比 磁盘 块 更 大 时 , 一 节 车 叮 可 
以 是 一 个 磁盘 块 , 否则 可 以 将 车 下 的 尺寸 设 得 更 大 。 但 是 车 厢 的 大 小 一 旦 确定 就 不 再 变化 。 多 节 车 
厢 被 组 织 成 列车 ( train) 。 一 辆 列车 中 的 车 厢 数 量 没有 限制 , 且 列 车 的 数量 也 没有 限制 。 车 厢 之 间 按 
照 词 典 顺序 进行 排序 : 首先 以 列车 号 排序 , 在 同一 列车 中 则 以 车 厢 号 排序 ,如 图 7-30 所 示 。 



































列车 1 | 幸而 11 | | 车 三 12 

列车 2 senior | | 车 岳 22 | | 车厢 23 | | 车 古 24 | 
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列车 3 431 | [32 | [车 后 33 























图 7-30 列车 算法 中 的 堆 区 组 织 








AIT AY BY ER SE 317 








列车 算法 有 两 种 回收 垃圾 的 方式 : 
e 在 一 个 增 量 式 垃圾 回收 步 又 中 , 按照 词典 顺序 排列 的 第 一 节 车 叮 ( 即 尚 存 的 第 一 辆 列车 中 
尚 存 的 第 一 节 车 帅 ) 首 先 被 回收 。 因 为 我 们 保留 了 一 个 来 自 该 车 厢 之 外 的 所 有 指针 的 “被 
记忆 "列表 , 所 以 这 一 步 类 似 于 世代 算法 中 针对 第 一 个 区 域 的 回收 步 又。 这 里 我 们 确定 出 
没有 任何 引用 的 对 象 , 以 及 完全 包含 在 这 节 车 晒 里 的 垃圾 循环 。 该 车 叮 中 的 可 达 对 象 总 
是 被 移 至 其 他 的 某 个 车 厌 中 , 因此 每 个 被 回收 过 的 车 而 都 变 成 空 车 而 ,可 以 从 这 辆 列车 
中 删除 。 
。 有 时, 第 一 辆 列车 没有 外 部 引用 。 也 就 是 说 , 没有 从 根 集 指向 该 列车 中 任何 车 硕 的 指 
St, 并 且 各 节 车 厢 中 的 被 记忆 集中 只 有 来 自 本 列车 的 其 他 车 朋 的 引用 , 没有 来 自 其 他 
列车 的 引用 。 在 这 种 情况 下 , 该 列车 就 是 一 个 巨大 的 循环 垃圾 集合 , 我 们 可 以 删除 整 
辆 列车 。 
被 记忆 集 
现在 我 们 给 出 列车 算法 的 细节 。 每 节 车 月 有 一 个 被 记忆 集 , 它 由 指向 该 车 磺 中 对 象 的 引用 
组 成 , 这 些 引 用 来 自 : 
1) 同一 辆 列车 中 序号 较 高 的 车 顺 中 的 对 象 ， 以 及 
2) 序号 较 高 的 列车 中 的 对 象 。 
此 外 , 每 辆 列车 有 一 个 被 记忆 集 , 它 由 来 自 较 高 序号 列车 中 的 引用 组 成 。 也 就 是 说 ， 一 个 列 
车 的 被 记忆 集 是 它 内 部 的 所 有 车 啉 的 被 记忆 和 集 的 并 集 , 但 是 不 包含 列车 内 部 的 引用 。 因 此 , 可 以 
将 车 朋 的 被 记忆 集 划 分 成 “内 部 ”( 同 一列 车) 和 “外 部 "(其 他 列车 ) 两 个 部 分 ,同时 表示 这 两 种 不 
同类 型 的 被 记忆 集 。 
注意 , 指向 这 些 对 象 的 引用 可 以 来 自 各 个 地 方 , 不 只 是 来 自 按 字典 顺序 排列 的 序号 较 高 的 车 
Mo Am, 算法 中 的 两 种 垃圾 回收 过 程 分 别处 理 第 一 辆 列车 的 第 一 节 车 磺 和 整个 第 一 辆 列车 。 
因此 , 当 在 垃圾 回收 中 需要 使 用 被 记忆 集 的 时 候 , 已 经 没有 更 早 的 地 方 可 以 有 引用 到 达 被 处 理 的 
车 厢 或 者 列车 。 因 此 记录 下 指向 较 高 序号 车 啉 的 引用 没有 什么 意义 。 当 然 , 我 们 必须 认真 、 正 确 
地 管理 被 记忆 集 , 只 要 增 变 者 改变 了 任何 对 象 中 的 引用 ,就 需要 相应 地 改变 被 记忆 集 。 
管理 列车 
我 们 的 目标 是 找 出 第 一 辆 列车 中 所 有 非 循环 垃圾 的 对 象 。 此 时 , 第 一 辆 列车 要 么 只 包含 了 
循环 垃圾 ， 因 此 将 在 下 一 轮 垃圾 回收 时 被 回收 ; 要 么 其 中 的 垃圾 不 是 循环 的 ,那么 它 的 车 是 就 可 
以 被 逐个 回收 。 
因为 对 一 辆 列车 中 的 车 旺 数 目 没有 限制 , 每 当 我 们 需要 更 多 空间 时 , 在 原则 上 我 们 可 以 直接 
向 一 辆 列车 中 加 入 新 的 车 师 。 但 是 , 我 们 偶尔 也 需要 创建 出 新 的 列车 。 例 如 , 我 们 可 以 设 定 每 创 
建 上 个 对 象 之 后 就 新 建 一 辆 列车 。 也 就 是 说 , 当 最 后 一 辆 列车 的 最 后 车 厢 中 还 有 足够 的 空间 时 ， 
”新 创建 的 对 象 一 般 会 被 放置 在 这 节 车 三 中 ; 如 果 该 车 厢 中 没有 足够 空间 ,该 对 象 就 会 被 放 到 一 个 
即将 被 加 到 最 后 一 个 车 三 之 后 的 新 车 厢 中 。 然 而 , 我 们 会 定期 新 建 一 列 只 有 一 节 和 车 须 的 列车 , 并 
将 新 对 象 放 和 人 其 中 。 
单 节 车 是 的 垃圾 回收 
列车 算法 的 核心 是 我 们 如 何在 一 轮 坛 瓜 回收 中 处 理 第 一 辆 列车 的 第 一 节 车 厢 。 一 开始 ,可 
达 集 包括 了 该 车 而 中 被 来 自 根 集 的 引用 指向 的 对 象 , 以 及 被 该 车 啉 的 被 记忆 集中 的 引用 指向 的 
对 象 。 然 后 , 我 们 像 标记 - 清扫 式 回 收 器 那样 扫描 这 些 对 象 , 但 是 不 会 扫描 任何 可 达 的 位 于 被 回 
收 车 而 之 外 的 对 象 。 在 这 次 跟踪 之 后 , 该 车 月 中 的 茶 些 对 象 可 能 被 确定 为 垃圾 。 央 为 无 论 如 何 
整 节 车 而 都 将 消失 , 因此 不 必 回 收 它 们 的 空间 。 











然而 , TAAL AR PAR T RE A EE GA THe, 这 些 对 象 必须 被 移 到 其 他 地 方 。 移 动 一 个 对 象 的 
规则 如 下 : 

o 如 果 被 记忆 集中 有 一 个 来 自 其 他 列车 的 引用 (该 列车 的 序号 高 于 被 回收 车 厢 所 在 列车 的 
序号 ) , 那么 将 这 个 对 象 移 到 这 些 列车 中 的 某 一 辆 中 。 如 果 在 发 出 一 个 引用 的 某 辆 列车 中 
能 够 找到 足够 的 空间 ， 就 将 该 对 象 移动 这 辆 列车 的 某 节 车 师 中 。 如 果 找 不 到 空间 ， 它 就 
进入 一 个 新 的 、 最 末端 的 车 月 。 

如 果 没 有 来 自 其 他 列车 的 引用 , 但 是 存在 来 自 根 集 或 第 一 辆 列车 的 引用 , 那么 就 将 此 对 
象 移 到 同一 列车 中 的 其 他 车 硬 中 。 如 果 没 有 足够 空间 ， 就 创建 一 个 新 的 车 三 放 到 列车 的 
末端 。 如 果 有 可 能 , 挑选 有 一 个 指向 该 对 象 的 引用 的 车 肛 , 以 尽快 把 循环 结构 放 到 同一 
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上 面 的 规则 还 存在 一 个 问题 。 为 了 保证 所 有 的 垃圾 最 终 都 会 被 回收 , 我 们 需要 保证 每 辆 列 
车 迟早 会 变 成 第 一 辆 列车 , 并 且 如 果 这 辆 列车 不 是 循环 垃圾 , 那么 此 列车 中 的 所 有 车 果 最 后 都 会 
被 删除 , 且 该 列车 每 次 至 少 会 减少 一 节 车 彩 。 然 而 , 根据 上 面 的 第 二 个 规则 ,回收 第 一 辆 列车 的 
第 一 节 车 硒 时 可 能 会 产生 一 个 位 于 最 后 的 新 车 量 。 这 个 过 程 不 会 创建 出 两 个 或 更 多 的 新 车 厅 ， 
因为 第 一 节 车 厢 中 的 所 有 对 象 一 定 能 够 被 一 起 放 到 最 后 的 新 车 大 中 。 然 而 , 是 否 会 出 现 这 种 情 
CL, 一 辆 列车 的 每 一 个 回收 步骤 都 产生 一 节 新 车 厢 ， 以 致 于 我 们 永远 不 能 回收 完 这 辆 列车 ， 结 
永远 不 能 继续 处 理 另 一 辆 列车 ? 

遗憾 的 是 , 这 种 情况 是 可 能 出 现 的 。 如 果 我 们 有 一 个 大 型 的 . 循环 的 非 垃圾 的 结构 ,并且 增 
变 者 改变 引用 的 方式 使 得 我 们 在 回收 一 节 车 而 时 一 直 没 有 在 被 记忆 集中 看 到 任何 来 自 较 高 序号 
列车 的 引用 ,就 会 出 现 上 述 问题 。 只 要 在 回收 一 节 车 胡 时 有 一 个 对 象 从 这 个 列车 中 移出 , 问题 就 
解决 了 , 因为 没有 新 的 对 象 会 被 加 入 到 第 一 辆 列车 中 , 所 以 第 一 辆 列车 中 的 所 有 对 象 最 终 一 定 会 
被 全 部 移出 。 然 而 , 有 可 能 在 某 个 阶段 我 们 根本 回收 不 到 任何 垃圾 , 这 样 就 会 存在 出 现 循环 的 风 
险 : 有 可 能 一 直 只 对 当前 的 第 一 辆 列车 进行 垃圾 回收 。 

为 了 避免 出 现 这 个 问题 ,只 要 我 们 直到 一 个 无 效 (futile) 垃 圾 回收 , 我 们 就 需要 改变 做 法 。 
所 谓 无 效 垃圾 回收 是 指 , 在 回收 一 节 车 厢 时 没有 一 个 对 象 可 以 作为 垃圾 删除 或 者 被 移动 到 男 一 
辆 列车 中 。 在 这 种 “和 恐 慌 模 式 " 下 ,我们 做 出 两 个 变化 : 

1) 当 指 向 第 一 辆 列车 中 的 某 个 对 象 的 某 个 引用 被 覆 写 时 ,我 们 将 这 个 引用 保留 为 根 集 的 一 
个 新 成 员 。 

2) 在 进行 垃圾 回收 时 , 如 果 第 一 节 车 帮 中 的 一 个 对 象 有 来 自 根 集 的 引用 , 其 中 包括 在 第 1 ， 
点 中 设置 的 哑 引 用 , 那么 即使 该 对 象 没 有 来 自 其 他 列车 的 引用 , 我 们 还 是 将 它 移 至 另 一 辆 列车 。 
只 要 不 是 移 到 第 一 辆 列车 , 移 到 哪 辆 列车 并 不 重要 。 





按照 这 个 方法 , 如 果 有 一 个 指向 第 一 辆 列车 的 对 象 的 引用 来 自 该 列车 之 外 ,在 我 们 回收 每 节 沁 


车 厢 时 都 会 考虑 这 些 引用 , 并且 最 终 必 然 会 有 一 些 对 象 从 那 辆 列车 移 除 。 然 后 , 我 们 就 可 以 脱离 ， 
恐慌 模式 ,继续 正常 处 理 ,确保 当前 的 第 一 辆 列车 一 定 要 比 以 前 小 。 
7.7.6 7.7 PHI 

练习 7. 7. 1: 假设 图 7-20 中 的 对 象 网 络 由 一 个 增 量 式 算法 进行 管理 。 该 算法 和 Baker 算法 
样 使 用 四 个 列表 Unreached, Unscanned 、Scarned 和 Free。 更 明确 地 说 , 列表 Unscanned 按照 队列 远 
行 管理 。 当 扫描 一 个 对 象 时 ， 如 果 有 多 个 对 象 要 被 放 进 这 个 列表 中 ,我们 按照 字母 顺序 加 入 爸 
们 。 同 时 假设 我 们 使 用 写 关 卡 来 保证 没有 可 达 对 象 被 当 作 垃 圾 。 在 开始 时 , AF BFE Unscannee __ 
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列表 中 , 假设 下 列 事件 发 生 : 

1) A 被 扫描 。 

2) 指针 AD BBE NH AH, 

3) BRA. 

4) D 被 扫描 。 

5) 指针 BoC BASHA BOI, 

iA ne ees, 模拟 整个 增 量 式 垃圾 回收 过 程 。 哪 些 对 象 是 垃圾 ?哪些 对 象 
被 放 在 了 列表 Free 中 ? “ 

练习 7. 7.2: 按照 如 下 假设 重复 练习 7.7.1: 

1) 事件 (2) 和 (5 ) 的 顺序 互 换 。 

2) 事件 (2) 和 (5) 在 (1)、(3) 和 (4) 之 前 发 生 。 

练习 7.7.3: 假设 堆 区 恰好 由 图 7-30 中 显示 的 三 辆 列车 ( 共 九 节 车 月 ) 组 成 ( 即 忽略 其 中 的 省 
MES). KAEM 12, 23 和 32 的 引用 指向 车 厢 11 中 的 对 象 o。 当 我 们 对 车 大 11 进行 垃圾 回 
收 , 对 象 o 最 后 在 什么 地 方 ? 

练习 7. 7. 4: 在 下 列 情况 下 重复 练习 7.7.3。 假 设 对 象 

1) RAX AEM 22 和 31 的 引用 。 

2) RAK AZ 11 之 外 的 指针 。 

练习 7. 7.5: 假设 推 区 恰好 由 图 7-30 中 显示 的 三 辆 列车 ( 共 九 节 车 晒 ) 组 成 ( 即 忽 略 其 中 的 省 
略 导 )。 当 前 我 们 处 于 怒 懂 模式 。 车 肛 11 中 的 对 象 o 只 有 一 个 来 自 车 呆 12 中 的 对 象 o 的 引用 。 
这 个 引用 被 覆 写 了 。 当 我 们 对 车 厢 11 进行 垃圾 回收 时 , 0 会 发 生 什么 事情 ? 

7.8 垃圾 回收 中 的 高 级 论题 

我 们 简要 地 介绍 下 面 的 四 个 论题 , 结束 我 们 对 垃圾 回收 的 研究 : 

1) 并 行 环境 下 的 垃圾 回收 。 

2) 对 象 的 部 分 重 定位 。 

3) 针对 类 型 不 安全 的 语言 的 垃圾 回收 。 

4) 程序 员 控 制 的 垃圾 回收 和 自动 垃圾 回收 之 间 的 交互 。 

7. 8.1 并 行 和 并 发 垃圾 回收 

当 将 垃圾 回收 应 用 到 并 发 或 多 处 理 器 机 器 上 运行 的 应 用 程序 时 , 这 一 工作 变 得 更 具有 挑战 
性 。 对 于 服务 器 应 用 , 在 同一 时 刻 运行 成 千 上 万 个 线程 是 常 有 的 事情 ; 其 中 的 每 个 线程 都 是 一 个 
增 变 者 。 堆 区 通常 会 包含 几 千 兆 的 存储 。 

可 处 理 大 规模 系统 的 垃圾 回收 算法 必须 充分 利用 系统 的 多 个 处 理 器 。 如 果 一 个 垃圾 回收 
器 使 用 多 个 线程 , 我 们 就 称 其 为 并 行 的 (parallel) 。 如 果 回 收回 和 增 变 者 同时 运行 ,就 说 它 是 
并 发 的 (concurrent ) 。 

我 们 将 描述 一 个 并 行 的 且 基 本 上 并 发 的 垃圾 回收 器 。 它 使 用 一 个 并 发 且 并 行 的 阶段 来 完成 
大 部 分 的 跟踪 工作 , 然后 执行 一 个 全 面 停顿 式 的 步骤 来 保证 找到 所 有 的 可 达 对 象 并 回收 存储 空 
间 。 这 个 算法 在 本 质 上 并 没有 引入 新 的 有 关 垃 圾 回收 的 基本 概念 , 它 说 明了 我 们 如 何 将 曾经 搞 
述 的 思想 组 合 起 来 , 创造 出 一 个 解决 并 发 、 并 行 的 垃圾 回收 问题 的 完整 解决 方案 。 然 而 , 并 行 执 
行 的 本 质 会 带 来 一 些 新 的 实现 问题 。 我 们 将 讨论 这 个 算法 如 何 使 用 一 个 相当 常见 的 工作 队列 模 
型 , 在 并 行 计 算 过 程 中 协调 多 个 线程 。 

为 了 理解 这 个 算法 的 设计 思想 , 我 们 必须 牢记 这 个 问题 的 规模 。 即 使 一 个 并 行 应 用 的 根 集 
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也 要 比 普 通 的 应 用 大 很 多 , 它 由 每 个 线程 的 栈 、 寄 存 器 集 和 全 局 可 访问 变量 组 成 。 堆 区 存储 的 数 
量 也 非常 大 ,可 达 数 据 的 数量 同样 也 很 大 。 增 变 过 程 发 生 速 率 也 比 一 般 的 应 用 高 很 多 。 

为 了 减少 停顿 时 间 , 我 们 可 以 采用 原本 为 增 量 式 分 析 而 设计 的 基本 思想 , 使 垃圾 回收 和 状态 
增 变 过 程 重 登 执行 。 请 回顾 一 下 , 正如 7.7 节 所 讨论 的 , 一 个 增 量 式 分 析 完 成 下 列 三 个 步 又: 

1) 找到 根 集 。 这 个 步骤 通常 是 以 原 语 方式 完成 的 , 即 增 变 者 暂时 停止 运行 。 

2) 增 变 者 的 执行 和 对 可 达 对 象 的 跟踪 交替 进行 。 在 这 个 阶段 ,每 次 有 一 个 增 变 者 写 人 一 个 
从 已 扫描 对 象 指 向 未 被 访问 对 象 的 引用 时 , 我 们 都 会 记录 这 个 引用 。 如 7.7.2 节 中 讨论 的 , 我 们 
可 以 选择 多 种 粒度 来 记录 这 些 引用 。 在 本 节 中 , 我 们 将 假定 使 用 基于 卡片 的 方案 。 我 们 将 堆 区 
分 成 者 干 被 称 为 “卡片 "的 区 段 ， 并 维护 一 个 位 映射 来 指明 哪个 卡片 是 脏 的 ( 即 其 中 有 一 个 或 多 个 
引用 被 覆 写 ) o 

3) 再 次 暂停 增 变 者 的 运行 ,重新 扫描 所 有 可 能 保存 了 指向 未 被 访问 对 象 的 引用 的 卡片 。 

对 于 一 个 大 型 多 线程 应 用 ,从 根 集 到 达 的 对 象 的 集合 可 能 非常 大 。 终 止 所 有 增 变 者 的 执行 ， 
然后 花费 很 多 时 间 和 空间 去 访问 所 有 这 样 的 对 象 是 不 可 行 的 。 同 时 ,因为 堆 的 规模 巨大 ,并且 增 
变 线程 数量 巨大 , 在 将 所 有 对 象 扫 描 一 次 之 后 , 很 多 卡片 都 需要 重新 扫描 。 此 时 ,值得 推荐 的 做 
法 是 并 行 地 扫描 其 中 的 某 些 卡 片 , 同时 允许 增 变 者 继续 并 发 执行 。 

为 了 并 行 地 实现 上 面 第 (2) 步 中 的 跟踪 过 程 , 我 们 将 使 用 多 个 垃圾 回收 线程 。 这 些 线 程 和 各 
个 增 变 者 线程 并 发 地 运行 ,以 跟踪 得 到 大 部 分 可 达 对 象 。 然 后 , 为 了 实现 第 (3) 步 , 我 们 暂停 执 
行 各 个 增 变 者 , 使 用 并 行 线程 来 保证 找到 所 有 的 可 达 对 象 。 

完成 第 (2) 步 中 跟踪 过 程 的 方法 是 让 每 个 增 变 者 线程 在 完成 其 自身 工作 的 同时 执行 部 分 垃圾 
回收 工作 。 另 外 , 我 们 也 使 用 一 些 专门 用 于 回收 垃圾 的 线程 。 一 旦 垃 圾 回收 过 程 启动 , 只 要 增 变 
者 线程 执行 了 某 个 内 存 分 配 操作 , 它 同时 也 会 执行 一 些 跟踪 计算 。 只 有 当 计算 机 中 有 空闲 的 时 
钟 周期 时 ,专用 的 垃圾 回收 线程 才 会 投 和 人 使用。 和 增 量 式 分 析 一 样 ， 只 要 增 变 者 写 人 了 一 个 从 已 
扫描 对 象 指向 未 被 访问 对 象 的 引用 , 存放 这 个 引用 的 卡片 就 被 标记 为 脏 的 , 需要 重新 扫描 。 

下 面 给 出 一 个 并 行 、 并 发 垃圾 回收 算法 的 大 概 描述 : 

1) 扫描 每 个 增 变 者 线程 的 根 集 , 将 所 有 可 以 从 根 集中 直接 到 达 的 对 象 设 为 待 扫描 状态 。 完 
成 这 一 步 的 最 简单 的 增 量 式 做 法 是 等 待 一 个 增 变 者 线程 调用 内 存 管 理 器 , 如 果 那 时 它 的 根 集 还 
没有 被 扫描 ,就 让 它 扫描 自己 的 根 集 。 如 果 所 有 其 他 跟踪 工作 都 已 经 完成 ,而 某 个 增 变 者 线程 还 
没有 调用 内 存 分 配 函 数 , 那么 必须 暂停 这 个 线程 , 扫描 它 的 根 集 。 

2) 扫描 处 于 待 扫 描 状 态 的 对 象 。 为 了 支持 并 行 计算 , 我 们 使 用 一 个 由 固定 大 小 的 工作 包 
(work packet ) 组 成 的 工作 队列 。 每 个 工作 包 保存 了 一 些 待 扫 描 对 象 。 当 发 现 待 扫描 对 象 时 , E 
们 就 被 放置 到 工作 包 中 。 等 待 工作 的 线程 将 从 队列 中 取出 这 些 工 作 包 ,并 跟踪 其 中 的 待 扫 描 对 
象 。 这 种 策略 允许 在 跟踪 过 程 中 把 工作 量 平均 分 配给 各 个 工作 线程 。 如 果 系 统 用 完了 存储 空间 ， 
使 得 我 们 无 法 找到 创建 这 些 工作 包 所 需 的 空间 , 就 直接 为 保存 这 些 对 象 的 卡片 加 上 标记 , 使 它们 
将 在 以 后 被 扫描 。 后 一 种 处 理 方法 总 是 可 行 的 , 因为 存放 卡片 标记 的 位 数组 已 经 预先 分 配 好 了 。 

3) 扫描 脏 卡 片 中 的 对 象 。 当 工作 队列 中 不 再 有 待 扫描 对 象 , 并 且 所 有 线程 的 根 集 都 已 经 被 
扫描 过 之 后 , 我 们 重新 扫描 这 些 卡片 以 寻找 可 达 对 象 。 只 要 增 变 者 继续 执行 , 脏 卡片 就 会 不 断 产 
生 。 因 此 , 我 们 需要 依照 某 种 标准 来 停止 跟踪 过 程 。 比 如 只 人 允许 卡片 被 再 次 扫描 一 次 或 固定 的 
次 数 , 或 者 当 未 完成 扫描 的 卡片 数量 减少 到 某 个 靖 值 时 停止 跟踪 。 这 人 么 做 的 结果 是 使 得 并 行 和 
并 发 步 又 通常 会 在 完成 全 部 跟踪 工作 之 前 就 停止 。 剩 下 的 工作 将 在 下 面 介 绍 的 最 后 一 步 中 完成 。 

4) 最 后 一 步 保 证 所 有 的 可 达 对 象 都 被 标记 为 已 被 访问 的 。 随 着 所 有 增 变 者 停止 执行 , 使 用 
系统 中 的 所 有 处 理 器 就 可 以 快速 找到 所 有 线程 的 根 集 。 因 为 大 部 分 可 达 对 象 已 经 被 跟踪 确定 ， 
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预计 只 有 少量 的 对 象 会 被 放 在 待 扫描 状态 中 。 所 有 的 线程 都 参与 了 对 其 余 可 达 对 象 的 跟踪 和 对 
所 有 卡片 的 重新 扫描 。 

我 们 必须 控制 启动 跟踪 过 程 的 频率 ,这 很 重要 。 跟 踪 步 又 就 像 是 一 场 赛跑 。 增 变 者 创建 出 必 
须 被 扫描 的 新 对 象 和 新 引用 , 而 跟踪 过 程 则 试图 扫描 所 有 可 达 对 象 , 并 重新 扫描 同时 产生 的 脏 卡 
片 。 在 需要 进行 垃圾 回收 之 前 过 分 频繁 地 启动 跟踪 过 程 是 没有 必要 的 , 因为 这 样 做 将 会 增加 漂 
HABE, AWM, 我 们 又 不 能 等 到 存储 耗 尽 时 才 开 始 跟踪 过 程 。 因 为 这 时 增 变 考 将 不 
能 继续 运行 ,此 时 的 情况 就 退化 为 使 用 全 面 停顿 式 回收 器 的 情形 。 因 此 , 算法 必须 适当 地 选择 启 
动 回收 的 时 机 和 跟踪 的 频率 。 对 前 面 的 各 轮 垃圾 回收 中 的 对 象 增 变速 率 的 佑 算 可 以 帮助 我 们 在 
这 方面 做 出 决策 。 根 据 专 用 垃圾 回收 线程 所 做 的 工作 量 , 可 以 动态 调整 跟踪 频率 。 

7.8.2 部 分 对 象 重 新 定位 

就 像 从 7. 6.4 节 开始 讨论 的 , 拷贝 或 压缩 回收 器 的 优势 在 于 消除 碎片 。 然 而 , 这 些 回收 器 需 
要 不 小 的 开销 。 压 缩 回 收 器 需要 在 垃圾 回收 结束 时 移动 所 有 的 对 象 并 更 新 所 有 的 引用 。 找 贝 回 
收 器 在 跟踪 过 程 中 就 找 出 可 达 对 象 的 位 置 。 如 果 跟 踪 采 用 增 量 式 执行 方式 , 我 们 要 么 对 增 变 者 的 
每 个 引用 进行 转换 , 要么 到 最 后 才 移 动 所 有 的 对 象 并 更 新 它们 的 引用 。 这 两 种 做 法 都 是 比较 昂 
贵 的 , 对 大 型 堆 区 来 说 尤其 如 此 。 

我 们 可 以 改 用 一 个 拨 由 世代 垃圾 回收 器 。 它 在 回收 年 轻 对 象 并 减少 碎片 方面 很 有 效 ， 但 是 
在 回收 成 熟 对 象 时 比较 昂贵 。 我 们 可 以 使 用 列车 算法 来 限制 每 次 分 析 时 处 理 的 成 熟 数 据 的 数量 。 
然而 , 列车 算法 的 代价 和 每 个 区 域 的 被 记忆 集 的 大 小 相关 。 

有 一 种 混合 型 的 回收 方案 , 它 使 用 并 发 跟踪 来 回收 所 有 不 可 达 对 象 ， 同 时 只 移动 部 分 对 象 。 
这 种 方法 减少 了 碎片 ， 又 不 会 因为 在 每 个 回收 循环 中 进行 重新 定位 而 引起 额外 的 开销 。 

1) 在 跟踪 开始 之 前 , 选择 将 被 清空 的 一 部 分 堆 区 。 

2) 当 标记 可 达 对 象 时 , 记 住所 有 指向 指定 区 域内 的 对 象 的 引用 。 

3) 当 跟 踪 完 成 时 , 并行 地 清扫 存储 空间 以 回收 被 不 可 达 对 象 占 用 的 空间 。 

4) 最 后 , 清空 占据 指定 区 域 的 可 达 对 象 , 并 修正 指向 被 清空 对 象 的 引用 。 

7.8.3 ”类 型 不 安全 的 语言 的 保守 垃圾 回收 

如 7.5.1 节 中 讨论 的 , 我 们 不 可 能 构造 出 一 个 可 以 处 理 所 有 C 和 C++ 程序 的 垃圾 回收 器 。 
因为 我 们 总 是 可 以 通过 算术 运算 来 计算 地 址 , 所 以 在 C 和 C++ 中 , 没有 任何 内 存 位 置 可 被 认为 
是 不 可 达 的 。 然 而 , 很 多 C 或 C++ 程 序 从 不 按照 这 种 方式 随意 地 构造 地 址 。 已 经 证 明 ， 人 们 可 
以 为 这 一 类 程序 构造 出 一 种 保守 的 垃圾 回收 器 (也 就 是 不 一 定 回收 所 有 垃圾 的 回收 器 ), 在 实践 
中 它 能 够 很 好 地 完成 任务 。 

保守 的 垃圾 回收 器 假定 我 们 不 可 以 随意 构造 出 一 个 地 址 , 或 者 在 没有 指向 茶 已 分 配 存 储 块 
中 某 处 的 地 址 的 情况 下 得 到 该 存储 块 的 地 址 。 我 们 可 以 在 程序 中 找 出 所 有 满足 这 一 假设 的 垃圾 。 
方法 是 ,对 于 在 任意 可 达 存 储 区 域 中 找到 的 一 个 二 进 制 位 模式 ， 如 果 该 模式 可 以 被 构造 成 一 个 内 
存 位 置 ， 我 们 就 认为 它 是 一 个 有 效 地 址 。 这 种 方案 可 能 会 把 有 些 数据 错 当 作 地 址 。 然 而 , 这 么 做 
是 正确 的 , 因为 这 只 会 使 得 垃圾 回收 器 保守 地 回收 垃圾 ， 留 下 的 数据 包含 了 所 有 必要 的 数据 。 

对 象 重 定位 需要 更 新 所 有 指向 旧地 址 的 引用 , 使 之 指向 新 地 址 , 因此 它 和 保守 的 垃圾 回收 方 
法 是 不 兼容 的 。 因 为 保守 的 垃圾 回收 器 并 不 能 确认 某 个 位 模式 是 否 真 的 指向 某 个 实际 地 址 ， 所 
以 它 不 能 修改 这 些 模式 并 使 之 指向 新 的 地 址 。 

下 面 是 一 个 保守 的 垃圾 回收 器 的 工作 方式 。 首 先 修改 内 存 管理 器 , 使 之 为 所 有 已 分 配 内 存 
块 保存 一 个 数据 映射 (data map)。 这 个 映射 使 我 们 很 容易 地 找到 一 个 内 存 块 的 起 止 位 置 。 这 两 
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个 起 止 位 置 跨越 对 多 个 地 由 跟踪 过 程 开始 时 ,首先 扫描 程序 的 根 集 , 找 出 所 有 看 起 来 像 内 存 位 
置 的 位 模式 , 此 时 我 们 不 考虑 它 的 类 型 。 通 过 在 数据 映射 中 查找 这 些 可 能 的 地 址 ,我 们 可 以 找 出 
所 有 可 能 通过 这 些 位 模式 到 达 的 内 存 块 的 开始 位 置 , 并 将 它们 置 为 待 扫 措 状态。 然后 , 我 们 扫描 
所 有 竺 扫描 的 内 存 块 , 找 册 更 多 (很 可 能 ) FT DS ERE, 并 且 将 它们 放 人 工作 列表 。 重 复 扫描 
WE, 直到 工作 列表 为 空 。 在 完成 跟踪 工作 之 后 , 我 们 使 用 上 述 数据 映射 来 清扫 整个 堆 区 , 定位 
并 释放 所 有 不 可 达 的 内 存 块 。 

7.8.4 BBR oo | 

有 时 候 , 虽然 程序 员 使 用 了 带 有 垃圾 回收 机 制 的 语言 ,但 是 仍然 希望 自己 管理 内 存 , REE 
理 部 分 内 存 。 也 就 是 说 ,尽管 仍然 存在 一 些 引用 指向 某 些 对 象 , 但 程序 员 知 道 这 些 对 象 不 会 再 被 
访问 。 一 个 来 自 编译 的 例子 可 以 说 明 这 一 问题 。 ; 
ERATE CABS, MATRA EE TASE, 为 它 碰 到 的 每 个 标识 符 创建 一 个 
对 象 。 比 如 ,这 些 对 象 可 能 作为 词法 值 被 附加 于 语法 分 析 树 中 代表 这 些 标识 符 的 叶子 结 点 上 。 
然而 , 以 这 些 标识 符 的 字符 目 作 为 键 值 构造 一 个 散 列表 有 助 于 对 这 些 对 象 进行 定位 。 这 个 散 列 
表 可 以 在 词法 分 析 器 碰 到 一 个 标识 符 词法 单元 时 更 容易 找到 对 应 的 对 象 。 

当 编 译 器 扫描 完 标识 符 1 的 作用 域 时 , [的 符号 表 对 象 不 再 有 任何 来 自 语法 分 析 树 的 引用 ， 
也 没有 来 自 可 能 被 编译 器 使 用 的 其 他 中 间 结 构 的 引用 。 然 而 ,在 散 列表 中 仍然 存在 一 个 指向 这 
个 对 象 的 引用 。 因 为 散 列表 是 编译 器 的 根 集 的 一 部 分 , 所 以 这 个 对 象 不 能 作为 垃圾 被 回收 。 如 
果 磁 到 了 另 一 个 词素 和 了 相同 的 标识 符 , 编译 器 就 会 发 现 1 已 经 过 时 了 , 指向 1 的 对 象 的 引用 将 
被 删除 。 然 而 , 如 果 没 有 直到 词素 相同 的 其 他 标识 符 , 那么 了 的 对 象 仍然 是 不 可 回收 的 , 尽管 在 
之 后 的 整个 编译 过 程 中 它 都 是 无 用 的 。 o 

如 果 例 子 7. 17 中 提出 的 问题 很 重要 , 那么 编译 器 的 作者 可 以 设法 在 标识 符 的 作用 域 一 结束 
时 就 在 散 列 表 中 删除 对 相应 对 象 的 所 有 引用 。 然 而 ， 一 种 被 称 为 弱 引 用 (weak reference) 的 技术 
支持 程序 员 依靠 自动 垃圾 回收 来 解决 问题 , 并且 不 会 因为 那些 实际 不 再 使 用 的 可 达 对 象 而 给 堆 
区 存储 带 来 负担 。 在 这 样 的 系统 中 ,允许 将 某 些 引 用 声明 为 “ 弱 " 引 用 。 弱 引用 的 一 个 例子 是 我 
们 刚刚 讨论 的 获 列 表 中 的 所 有 引用 。 当 垃圾 回收 器 扫描 一 个 对 象 时 ， 它 不 会 沿 着 该 对 象 内 的 弱 
引用 前 进 ， 也 不 会 将 它们 指向 的 对 象 设置 为 可 达 的 。 当 然 , 如 果 另 有 一 个 不 弱 的 引用 指向 这 一 个 
对 象 , 这 个 对 象 可 能 仍然 是 可 达 的 。 
7.8.5 7.8 节 的 练习  、 

| 练习 7. 8. 1: 在 7.8. 3 WP, 我 们 说 如 果 一 个 C 语言 程序 只 会 在 已 存在 某 个 指向 某 存储 块 
中 某 个 位 置 的 地 址 时 构造 出 指向 这 块 内 存 中 某 个 位 置 的 地 址 , 我 们 就 可 以 对 这 个 程序 进行 垃 瓜 
回收 。 因 此 我 们 将 形 如 

x = *p; e 
的 代码 排除 在 外 ,因为 即使 没有 指针 指向 某 个 存储 块 , p 仍然 可 能 碰巧 指向 该 存储 块 。 另 一 方 
面 , 对 于 上 面 的 代码 , 更 可 能 发 生 的 情况 是 p 什么 地 方 都 不 指 , 执行 那个 代码 会 引起 一 个 内 存 分 
段 错 误 。 然 而 , 用 C 语 言 可 能 写 出 一 段 代码 ,使 得 一 个 像 p 这 样 的 变量 一 定 指向 某 个 存储 块 , E 
没有 其 他 指针 同时 指向 该 存储 块 。 写 出 一 个 这 样 的 程序 。 


7.9 第 7 章 总 结 


o 运行 时 刻 组 织 。 为 了 实现 源 语言 中 的 抽象 概念 , 编译 器 与 操作 系统 及 目标 机 器 协同 , 创 
建 并 管理 了 一 个 运行 时 刻 环境 。 该 运行 时 刻 环境 有 一 个 静态 数据 区 , 用 于 存放 对 象 代码 
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和 在 编译 时 刻 创建 的 静态 数据 对 象 。 同 时 它 还 有 动态 的 栈 区 和 堆 区 , 用 来 管理 在 目标 代 
码 执行 时 创建 和 销毁 的 对 象 。 

控制 栈 。 过 程 调用 和 返回 通常 由 称 为 控制 乒 的 运行 时 刻 栈 管理 。 我 们 可 以 使 用 栈 结构 的 
原因 是 过 程 调用 (或 者 说 活动 ) 在 时 间 上 是 舱 套 的 。 也 就 是 说 ,如 果 疡 调用 9, WA q 的 活 
IRRE p 的 活动 之 内 。 

找 分 配 。 对 于 那些 允许 或 要 求 局 部 变量 在 它们 的 过 程 结束 之 后 就 不 可 访问 的 语言 而 言 ， 
局 部 变量 
在 控制 栈 中 有 -个 活动 记录 (或 者 说 帧 ) 。 活 动 树 的 根 结 点 位 于 栈 底 ， 而 栈 中 的 全 部 活动 
记录 对 应 于 活动 树 中 到 达 当 前 控制 所 在 活动 的 路 径 。 当 前 活动 的 记录 位 于 栈 顶 。 

访问 栈 中 的 非 局 部 数据 。 像 C 这 样 的 语言 不 支持 向 套 的 过 程 声明 ,因此 一 个 变量 的 位 置 
要 么 是 全 局 的 , 要 么 可 以 在 运行 时 刻 栈 顶 的 活动 记录 中 找到 。 对 于 带 有 骨 套 过 程 的 语言 
而 言 , 我 们 可 以 通过 访问 链 来 访问 栈 中 的 非 局 部 数据 。 访 问 链 是 加 在 各 个 活动 记录 中 的 
指针 。 可 以 顺 着 访问 链 组 成 的 链 路 到 达 正 确 的 活动 记录 ,从 而 找到 期 待 的 非 局 部 数据 。 
显示 表 是 一 个 和 访问 链 联合 使 用 的 辅助 数组 ， 它 提供 了 一 个 不 需要 使 用 访问 链 链 路 的 高 
效 捷径 。 

堆 管理 。 堆 是 用 来 存放 生 使 周 期 不 确定 的 ， 或 者 可 以 生存 到 被 明确 删除 时 刻 的 数据 的 存 
储 区 域 。 存 储 管理 器 分 配 和 回收 堆 区 中 的 空间 。 垃 圾 回收 在 堆 区 中 找 出 不 再 被 使 用 的 空 

E, 这 些 空间 可 以 回收 并 用 于 存放 其 他 数据 项 。 对 于 要 求 垃圾 回收 的 语言 , 垃圾 回收 器 
是 存储 管理 器 的 一 个 重要 子 系统 。 

利用 局 部 性 。 通 过 更 好 地 利用 存储 的 层次 结构 ,存储 管理 器 可 以 影响 程序 的 运行 时 间 。 
访问 存储 的 不 同 区 域 所 花 的 时 间 可 能 从 几 纳 秒 到 几 毫 秒 不 等 。 幸 运 的 是 , 大 部 分 程序 将 
它们 的 大 部 分 时 间 用 于 执行 相对 较 小 的 一 部 分 代码 , 并 且 此 时 只 会 访问 一 小 部 分 数据 。 
如 果 一 个 程序 很 可 能 在 短期 内 再 次 访问 刚刚 访问 过 的 存储 位 置 ,该 程序 就 具有 时 间 局 部 
性 。 如 果 一 个 程序 很 可 能 访问 刚刚 访问 的 存储 区 域 附近 的 位 置 , 该 程序 就 具有 空间 局 
部 性 。 

减少 碎片 。 随 着 程序 分 配 和 回收 存储 , 堆 区 可 能 会 变 得 破碎 , 或 者 说 被 分 割 成 大 量 细 小 
且 不 连续 的 空闲 空间 (或 称 为 “窗口 ”) best-fit 策略 (分 配 能 够 满足 空间 请 求 的 最 小 可 用 
“和 窗口”) 经 实践 证 明 是 有 效 的 。 尽 管 best-fit 策略 提高 了 空间 利用 率 , 但 对 于 空间 局 部 性 
而 言 它 可 能 并 不 是 最 好 的 。 可 以 通过 合并 或 者 说 接合 相 邻 的 “窗口 "来 减少 碎片 。 

人 工 回 收 。 人 工 存储 管理 有 两 个 常见 的 问题 : 没有 删除 那些 不 可 能 再 被 引用 的 数据 ,这 
称 为 内 看 泄漏 错误 ; 引用 已 经 被 删除 的 数据 ,这 称 为 悬空 指针 引用 错误 。 

可 达 性 。 上 垃圾 就 是 不 能 被 引用 或 者 说 到 达 的 数据 。 有 两 种 寻找 不 可 达 对 象 的 基本 方法 : 
要么 截获 一 个 对 象 从 可 达 变 成 不 可 达 的 转换 , 要 么 周期 性 地 定位 所 有 可 达 对 象 , 并 推导 
出 其 余 对 象 都 是 不 可 达 的 。 

引用 计数 回收 器 维护 了 指向 一 个 对 象 的 引用 的 计数 。 当 这 个 计数 变 为 0 时 , 该 对 象 就 变 
成 不 可 达 的 。 这 样 的 回收 器 带 来 了 维护 引用 的 开销 , 并 且 可 能 无 法 找 出 “循环 "的 垃圾 ， 
即 由 相互 引用 的 不 可 达 对 象 组 成 的 垃圾 。 这 些 垃 圾 也 可 能 通过 由 引用 组 成 的 链 路 相互 
引用 。 

基于 跟踪 的 垃圾 回收 器 从 根 集 出 发 , 迭代 地 检查 或 跟踪 所 有 的 引用 , 找 出 所 有 可 达 对 象 。 
根 集 包括 了 所 有 不 需要 对 任何 指针 解 引用 就 可 直接 访问 的 对 象 。 





























© 标记 一 清扫 式 回收 器 在 一 开始 的 跟踪 阶段 访问 并 标记 所 有 可 达 对 象 , 然后 清扫 堆 区 , E 
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收 不 可 达 对 象 。 
e 标记 并 压缩 回收 器 改进 了 标记 并 清扫 算法 。 它 们 把 堆 区 中 的 可 达 对 象 重新 定位 ， 从 而 消 
除 存 储 碎 片 。 
e 拷贝 回收 器 将 跟踪 过 程 和 发 现 空 闪 空间 过 程 之 间 的 依赖 关系 打破 。 它 将 存储 分 为 两 个 半 
空间 4 和 8B。 首 先 使 用 某 个 半空 间 ， 比 如 说 4, 来 满足 分 配 请 求 , 直到 它 被 填 满 。 此 时 垃 
SKIMMER THE, 将 可 达 对 象 拷贝 到 另 一 个 半空 间 , 也 就 是 了 , 然后 对 换 两 个 半空 间 的 
角色 。 
增 量 式 回 收 器 。 简 单 的 基于 女 踪 的 回收 器 在 垃圾 回收 期 间 会 停止 用 户 程序 的 执行 。 增 量 
式 回 收 器 让 垃圾 回收 过 程 和 用 户 程序 (或 者 说 增 变 者 ) 交 错 运行 。 增 变 者 可 能 干扰 增 量 式 
可 达 性 分 析 , 因为 它 可 能 改变 之 前 已 扫描 对 象 中 的 引用 。 因 此 , 增 量 式 回收 器 通过 超 量 
估计 可 达 对 象 集合 , 达到 安全 工作 的 目标 。 所 有 的 “漂浮 垃圾 ”可 以 在 下 一 轮回 收 中 被 
删除 。 
部 分 回收 器 同样 可 以 减少 停顿 时 间 。 它 们 每 次 只 回收 一 部 分 垃圾 。 最 有 名 的 部 分 回收 算 
法 是 世代 垃圾 回收 方法 , 它 根 据 对 象 已 分 配 时 间 的 长 短 对 对 和 象 分 区 , 对 新 建 对 象 进行 更 
频繁 的 回收 操作 , 因为 它们 的 生命 期 通常 较 短 。 另 一 个 算法 列车 算法 使 用 固定 长 度 的 被 
称 为 车 厢 的 区 域 。 这 些 车 三 被 组 织 成 列车 。 每 一 个 回收 步骤 都 处 理 尚 存 的 第 一 辆 列车 中 
的 当前 的 第 一 节 车 而 。 当 一 节 车 三 被 回收 时 , 可 达 对 象 被 移动 到 其 他 车 须 中 , RAR 
中 最 终 只 剩 下 垃圾 , 因此 可 以 将 其 从 该 列车 中 删除 。 这 两 种 算法 可 以 一 起 使 用 , 创建 出 
一 个 部 分 回收 器 。 该 回收 器 对 较 年 轻 对 象 使 用 世代 算法 , 对 较 成 熟 的 对 象 使 用 列车 算法 。 
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第 8 章 代码 生成 


我 们 的 编译 器 模型 的 最 后 一 个 步骤 是 代码 生成 器 。 如 图 8-1 所 示 , 它 以 编译 器 前 端 生成 的 中 
间 表 示 (IR) 和 相关 的 符号 表 信 息 作 为 输入 , 输出 语义 等 价 的 目标 程序 。 
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图 8-1 代码 生成 器 的 位 置 


对 代码 生成 器 的 要 求 是 很 严格 的 。 有 目标 程序 必须 保持 源 程 序 的 语义 含义 ,还 必须 具有 很 高 
的 质量 。 也 就 是 说 , 它 必 须 有 效 地 利用 目标 机 器 上 的 可 用 资源 。 此 外 ,代码 生成 器 本 身 必 须 能 够 
高 效 运行 。 

具有 挑战 性 的 是 , 从 数学 上 讲 , 为 给 定 源 程序 生成 一 个 最 优 的 目标 程序 是 不 可 判定 问题 , 在 代 
码 生 成 中 碰 到 的 很 多 子 问题 ( 比如 寄存 器 分 配 ) 都 具有 难以 处 理 的 计算 复杂 性 。 在 实践 中 , 我 们 必须 
使 用 那些 能 够 产生 良好 但 不 一 定 最 优 的 代码 的 启发 性 技术 。 幸 运 的 是 , 启发 性 技术 已 经 非常 成 熟 ， 
一 个 精心 设计 的 代码 生成 器 所 产生 的 代码 要 比 那些 由 简单 的 生成 器 生成 的 代码 快 好 几 倍 。 

要 产生 高 效 目标 程序 的 编译 器 都 会 在 代码 生成 之 前 包含 一 个 优化 步骤。 优化 器 把 一 个 IR 映 





— 射 为 另 一 个 可 用 于 产生 高 效 代 码 的 了。 编译 器 的 代码 优化 和 代码 生成 步骤 通常 被 称 为 编译 器 的 


后 端 (back end) 。 它 们 可 能 在 生成 目标 程序 之 前 对 IR 作 多 趟 处 理 。 代 码 优化 将 在 第 9 章 中 详细 
讨论 。 不 论 代 码 生 成 之 前 有 没有 优化 步骤 , 都 可 以 使 用 本 章 所 讨论 的 技术 。 

代码 生成 器 有 三 个 主要 任务 : 指令 选择 、 寄 存 器 分 配 和 指派 、 以 及 指令 排序 。 这 些 任 务 的 重 
要 性 将 在 8. 1 节 中 概述 。 指 令 选择 考虑 的 问题 是 选择 适当 的 目标 机 指令 来 实现 IR 语句 。 寡 存 器 
分 配 和 指派 考虑 的 问题 是 把 哪个 值 放 在 鄂 个 寄存 器 中 。 指 令 排序 考虑 的 问题 是 按照 什么 顺序 来 
安排 指令 的 执行 。 ; 

本 章 给 出 了 一 些 和 代码 生成 相关 的 算法 , 代码 生成 器 可 以 使 用 这 些 算法 把 输入 的 IR 翻译 成 
简单 寄存 器 机 器 的 目标 语言 指令 序列 。 这 些 算法 将 使 用 8.2 节 中 的 机 器 模型 来 解释 。 第 10 章 讨 
论 了 复杂 的 现代 机 器 的 代码 生成 问题 , 这些 现代 机 器 支持 在 单一 指令 中 的 大 量 并 行 性 。 

在 讨论 了 代码 生成 器 设计 中 的 众多 难题 之 后 , 我 们 给 出 了 一 个 编译 器 需要 生成 什么 样 的 目 
标 代 码 , 以 支持 常见 源 语言 中 所 包含 的 抽象 机 制 。 在 8. 3 节 , 我 们 概述 了 静态 和 栈 式 数据 区 分 配 
的 实现 方法 ,并 说 明 如 何 把 IR 中 的 名 字 转 换 成 为 且 标 代码 中 的 地 址 。 

很 多 代码 生成 器 把 IR 指令 分 成 “基本 块 ”, 每 个 基本 块 由 一 组 总 是 一 起 执行 的 指令 组 成 。 把 
TR 划分 成 基本 块 是 8.4 节 的 主题 。 接 下 来 介绍 了 针对 基本 块 的 一 些 简单 的 局 部 转换 方法 。 从 转 
换 得 到 的 基本 块 出 发 可 以 生成 更 加 高 效 的 代码 。 虽 然 要 到 第 9 章 才 开始 考虑 更 加 深入 的 代码 优 
化 理论 , 但 这 种 转换 已 经 是 代码 优化 的 初步 形式 。 一 个 有 用 的 局 部 转换 的 例子 是 在 中 间 代 码 的 
层次 上 寻找 公共 子 表达 式 ， 然 后 相应 地 把 算术 运算 替换 为 更 简单 的 拷贝 运算 。 ; 

8.6 节 给 出 了 一 个 简单 的 代码 生成 算法 。 它 依次 为 每 个 语句 生成 代码 ,并 把 运算 分 量 尽 可 能 ， 
长 时 间 地 保留 在 寄存 器 中 。 这 种 代码 生成 器 的 输出 可 以 很 容易 地 使 用 罕 孔 优化 技术 进行 优化 。 
接 下 来 的 8.7 节 中 将 讨论 据 孔 优化 技术 。 

其 余 的 部 分 将 研究 指令 选择 和 寄存 器 分 配 。 
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8.1 代码 生成 器 设计 中 的 问题 

虽然 代码 生成 器 设计 依赖 于 中 间 表 示 形 式 、 目 标语 言 和 运行 时 刻 系 统 的 特定 细节 , 但 指令 选 
择 、 寄 存 器 分 配 和 指派 以 及 指令 排序 等 任务 会 在 几乎 所 有 的 代码 生成 器 设计 中 碰 到 。 

代码 生成 器 的 最 重要 的 标准 是 生成 正确 的 代码 。 正 确 性 问题 非常 突出 的 原因 是 代码 生成 器 
会 碰 到 很 多 种 特殊 情况 。 在 优先 考虑 正确 性 的 情况 下 , 另 一 个 重要 的 设计 目标 是 把 代码 生成 器 
设计 得 易于 实现 、 测 试 和 维护 。 

8.1.1 代码 生成 器 的 输入 

代码 生成 器 的 输入 是 由 前 端 生成 的 源 程序 的 中 间 表 示 形 式 以 及 符 号 表 中 的 信息 组 成 的 。 这 
些 信息 用 来 确定 IR 中 的 名 字 所 指 的 数据 对 象 的 运行 时 刻 地 址 。 

IR 的 中 间 表 示 形 式 的 选择 有 很 多 , 包括 诸如 四 元 式 、 三 元 式 、 间 接 三 元 式 等 三 地 址 表示 方 
式 ; 也 包括 诸如 字 节 代码 和 堆栈 机 代码 的 虚拟 机 表示 方式 ; 包括 诸如 后 缀 表示 的 线性 表示 方式 ; 
还 包括 诸如 语法 树 和 DAG 的 图 形 表示 方式 。 本 章 中 的 多 个 算法 都 是 根据 第 6 章 中 所 考虑 的 表示 
方法 来 表示 的 。 这 些 表示 方法 包括 : 三 地 址 代码 、 树 和 DAC。 然 而 , 我 们 讨论 aay 
其 他 的 中 间 表 示 形 式 。 

在 本 章 中 , 我 们 假设 前 端 已 经 扫 找 、 分 析 了 源 程 序 , 并 把 它 转换 成 为 相对 低层 次 的 中 间 表 示 
形式 , 因此 在 IR 中 出 现 的 名 字 的 值 可 以 用 能 被 目标 机 直接 处 理 的 量 来 表示 。 这 些 量 可 以 是 整数 、 
浮 点 数 等 。 我 们 还 假设 所 有 的 语法 和 静态 语义 错误 都 已 经 被 检测 出 来 , 必要 的 类 型 检查 都 已 经 
完成 , 而 类 型 转换 运算 已 经 被 插入 到 必要 的 地 方 。 因 此 , 代码 生成 器 可 以 在 工作 过 程 中 假设 它 的 
输入 已 经 排除 了 这 些 错误 。 

8. 1.2 目标 程序 

构造 一 个 能 够 产生 高 质量 机 器 代码 的 代码 生成 器 的 难度 会 受到 目标 机 器 的 指令 集体 系 结构 
的 极 大 影响 。 最 常见 的 目标 机 体系 结构 是 RISC( 精简 指令 集 计 算 机 ) CISC 复杂 指令 集 计 算 机 ) 
和 基于 堆栈 的 结构 。 

RISC 机 通常 有 很 多 寄存 器 、 三 地 址 指令 ; 简单 的 寻 址 方式 和 一 个 相对 简单 的 指令 集体 系 结 
构 。 相 反 ，CISC 机 通常 具有 较 少 寄存 器 、 两 地 址 指令 、 多 种 寻 址 方式 、 多 种 类 型 的 寄存 器 、 可 变 
长 度 的 指令 和 具有 副作用 的 指令 。 

在 基于 栈 的 机 器 中 , 运算 是 通过 把 运算 分 量 压 人 一 个 栈 , 然后 再 对 栈 顶 的 运算 分 量 进行 运算 
而 完成 的 。 为 了 获得 高 性 能 , 栈 顶 元 素 通常 保存 在 寄存 器 中 。 因 为 人 们 觉得 堆栈 组 织 的 限制 太 
£, 并 且 需 要 太 多 的 交换 和 拷贝 操作 ,所 以 基于 堆栈 的 机 器 几乎 已 经 消失 了 。 

但 是 , 基于 堆栈 的 体系 结构 随 着 Java 虚拟 机 (JVM) 的 出 现 又 复活 了 。JVM 是 一 个 Java 字 节 
码 的 软件 解释 器 。 字 节 码 是 由 Java 编译 器 生成 的 一 种 中 间 语 言 。 这 个 解释 器 提供 了 跨 平 台 的 软 
件 兼 容 性 。 这 是 Java 成 功 的 一 个 重要 因素 。 

解释 执行 会 引起 很 高 的 性 能 损失 , 有 时 可 能 达到 10 倍 的 数量 级 。 为 了 克服 这 个 问题 ， 人们 
A T ENR} (Just-In-Time, JIT) Java 编译 器 。 这 些 即时 编译 器 在 运行 时 刻 把 字 节 码 翻 译 成 目标 机 
上 的 本 地 硬件 指令 集 。 另 一 个 提高 Java 程序 性 能 的 方法 是 建立 一 个 编译 器 , 把 Java 程序 直接 编 
译 成 目标 机 器 指令 , 彻底 绕 过 字 节 码 。 

输出 一 个 使 用 绝对 地 址 的 机 器 语言 程序 的 优点 是 程序 可 以 放 在 内 存 中 的 某 个 固定 位 置 上 ， 
并 立即 执行 。 程 序 可 以 很 快 地 进行 编译 和 执行 。 

输出 可 重 定位 的 机 器 语言 程序 (通常 称 为 目标 模块 ，object module) 可 以 使 各 个 子 程序 能 够 被 
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分 别 编译 。 一 组 可 重 定位 的 目标 模块 可 以 被 一 个 链接 加 载 器 链接 到 一 起 并 加 载运 行 。 如 果 我 们 
要 生成 可 重 定位 的 目标 模块 , 我 们 就 必须 为 链接 和 加载 付 出 代价 。 但 是 这 样 做 可 以 使 我 们 得 到 
很 多 的 灵活 性 。 我 们 可 以 把 子 程序 分 开 编 译 , 并 能 够 从 一 个 目标 模块 中 调用 其 他 已 经 编译 好 的 
程序 。 如 果 目 标 机 没有 自动 处 理 重 定位 , 编译 器 就 必须 向 加 载 器 提供 明确 的 重 定位 信息 ,以 便 把 
分 开 编译 的 程序 模块 链接 起 来 。 

输出 一 个 汇编 程序 使 代码 生成 过 程 变 得 稍微 容易 一 些 。 我 们 可 以 生成 符号 指令 ， 并 使 用 汇 
编 器 的 宏 机 制 来 帮助 生成 代码 。 这 么 做 的 代价 是 代码 生成 之 后 还 需要 增加 一 个 汇编 步骤 。 

在 本 章 中 , 我 们 将 使 用 一 个 非常 简单 的 类 RISC 计算 机 作为 目标 机 。 我 们 在 这 个 机 器 上 加 入 
了 一 些 类 CISC 的 寻 址 方式 。 这 样 我 们 就 可 以 讨论 CISC 机 器 的 代码 生成 技术 了 。 为 了 增加 可 读 
性 , 我 们 把 汇编 代码 用 作 目 标语 言 。 只 要 变量 地 址 可 以 通过 偏 移 量 和 存放 于 符号 表 中 的 其 他 信 
息 计算 出 来 ,代码 生成 器 就 可 以 为 源 程序 中 的 名 字 生 成 可 重 定位 地 址 或 绝对 地 址 。 这 和 生成 符 
号 地 址 一 样 ,都 是 很 简单 的 事情 。 

8. 1.3 指令 选择 

代码 生成 器 必须 把 IR 程序 映射 成 为 可 以 在 目标 机 上 运行 的 代码 序列 。 完 成 这 个 映射 的 复杂 
性 由 如 下 的 因素 决定 : 

© IR 的 层次 。 

。 指令 集体 系 结构 本 身 的 特性 。 

e 想 要 达到 的 生成 代码 的 质量 。 

如 果 IR 是 高 层次 的 ,代码 生成 器 就 要 使 用 代码 模板 把 每 个 R 语句 翻译 成 为 机 器 指令 序列 。 
但 是 , 这 种 逐个 语句 生成 代码 的 方式 通常 会 产生 质量 不 佳 的 代码 。 这 些 代码 需要 进一步 优化 。 
如 果 IR 中 反映 了 相关 计算 机 的 某 些 低层 次 细节 , 那么 代码 生成 器 就 可 以 使 用 这 些 信息 来 生成 更 
加 高 效 的 代码 序列 。 

目标 机 指令 集 本 身 的 特性 对 指令 选择 的 难度 有 很 大 的 影响 。 比 如 , 指令 集 的 统一 性 和 完整 
性 是 两 个 很 重要 的 因素 。 如 果 目 标 机 没有 以 统一 的 方式 支持 每 种 数据 类 型 , 那么 总 体 规则 的 每 
个 例外 都 需要 进行 特别 处 理 。 比 如 , 在 某 些 机 器 上 , 浮 点 数 运 算 使 用 单独 的 寄存 器 完成 。 

指令 速度 和 机 器 的 特有 用 法 是 另外 一 些 重要 因素 。 如 果 我 们 不 考虑 目标 程序 的 效率 , 那么 
指令 选择 是 很 简单 的 。 对 于 每 一 种 三 地 址 语句 , 我 们 可 以 生成 一 个 代码 骨架 。 此 上 骨架 定义 了 对 
这 个 构造 生成 什么 样 的 目标 代码 。 比 如 , 每 一 个 形 如 x =y +2 的 三 地 址 语句 (其 中 x、y 和 z 都 
是 静态 分 配 的 ) 可 以 被 翻译 成 如 下 的 代码 序列 : 


LD RO, y // R0 =y (把 y 装载 到 寄存 器 RO) 
ADD RO, RO,z // RO=RO+2 GE z 加 到 RO) 
ST x, RO // x = RO (把 RO 保存 到 x ) 


这 种 策略 常常 会 产生 元 余 的 加 载 和 存储 运算 。 比 如 , 下 面 的 三 地 址 语句 序列 


a=bte 


d=ate 
会 被 翻译 成 

LD RO, b // RO = 
ADD RO, RO, c // RO=RO +c 
ST a, RO // a= RO 

LD RO, a // R0 =a 

ADD RO, RO, e // RO =RO +e 
ST d. RO // ad = RO 


这 里 的 第 四 个 语句 是 元 余 的 , 因为 它 加 载 了 一 个 刚刚 保存 到 内 存 的 值 。 并 且 如 果 a 以 后 不 再 被 
使 用 , 那么 第 三 个 语句 也 是 元 余 的 。 
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生成 代码 的 质量 通常 是 由 它 的 运行 速度 和 大 小 来 确定 的 。 在 大 多 数 机 器 上 ,一 个 给 定 的 IR 程 
序 可 以 用 很 多 种 不 同 的 代码 序列 来 实现 。 这 些 不 同 实现 之 间 在 代价 上 有 着 显著 的 差别 。 因 此 ， 对 中 
间 代 码 的 简单 翻译 虽然 能 产生 正确 的 目标 代码 , 但 是 这 些 代码 却 可 能 过 于 低 效 而 让 人 不 可 接受 。 

比如 ,如 果 目 标 机 有 一 个 “加 一 ”指令 (INC), 那么 三 地 址 语句 a =a+1 可 以 用 一 个 指令 
INC a 来 实现 。 这 个 指令 要 比如 下 的 代码 序列 更 加 高 效 : 把 a 加 载 进 一 个 寄存 器 , 对 寄存 器 加 1， 
然后 把 结果 保存 回 a。 


LD RO, a // RO = a 
ADD RO, RO, #1 // RO = RO + 1 
ST a, RO // a= RO 


要 设计 出 良好 的 代码 序列 ,我 们 就 必须 知道 指令 的 代价 。 遗 憾 的 是 , 我 们 经 常 难以 得 到 精确 
的 代价 信息 。 对 于 一 个 给 定 的 三 地 址 构造 , 可 能 还 需要 有 关 该 构造 所 在 上 下 文 的 信息 才能 决定 
哪个 是 最 好 的 机 器 代码 序列 。 

在 8.9 节 , 我 们 将 看 到 指令 选择 可 以 用 树 模式 匹配 过 程 来 建 模 。 在 这 个 过 程 中 , 我 们 把 IR 
和 机 器 指令 表示 为 树 结构 。 然 后 , 我 们 尝试 着 用 一 组 对 应 于 机 器 指令 的 子 树 覆盖 一 棵 IR 树 。 如 
果 我 们 把 每 棵 机 器 指令 子 树 和 一 个 代价 值 相 关联 , 我们 就 可 以 用 动态 规划 的 方法 来 生成 最 优化 
的 代码 序列 。 动 态 规划 将 在 8. 11 节 中 讨论 。 
8.1.4 寄存 器 分 配 

代码 生成 的 关键 问题 之 一 是 决定 哪个 信 放 在 哪个 寄存 器 里 面 。 寄 存 器 是 目标 机 上 运行 速度 
最 快 的 计算 单元 , 但 是 我 们 通常 没有 足够 的 寄存 器 来 存放 所 有 的 值 。 没 有 存放 在 寄存 器 中 的 值 
必须 存放 在 内 存 中 。 使 用 寄存 器 运算 分 量 的 指令 总 是 要 比 那些 运算 分 量 在 内 存 中 的 指令 短 并 且 
快 。 因 此 ,有 效 利用 寄存 器 非常 重要 。 

寄存 器 的 使 用 经 常 被 分 解 为 两 个 子 问题 : 

1) FERDE: 对 于 源 程序 中 的 每 个 点 ,我 们 选择 一 组 将 被 存放 在 寄存 器 中 的 变量 。 

2) 寄存 器 指派 : 我 们 指定 一 个 变量 被 存放 在 哪个 寄存 器 中 。 

即使 对 于 单 寄存 器 机 器 , 找到 一 个 从 寄存 器 到 变量 的 最 优 指派 也 是 很 困难 的 。 从 数学 上 讲 ， 
这 个 问题 是 NP 完全 的 。 而 且 , 目标 机 的 硬件 和 /或 操作 系统 可 能 要 求 代码 遵守 特定 的 寄存 器 使 
用 规则 ， 从 而 使 这 个 问题 变 得 更 加 复杂 。 
[ 轩 汪 有 些 机 器 要 求 为 某 些 运算 分 量 和 结果 使 用 寄存 器 对 ( 即 一 个 偶数 号 寄存 器 和 相 邻 的 奇数 
号 寄存 器 ) 。 比 如 , 在 某 些 机 器 上 , 整数 乘法 和 整数 除法 就 涉 














t=atb t=athb 
及 寄存 器 对 。 乘 法 指令 的 形式 如 下 ; > R 
Mx, y Ty 区 
其 中 被 乘 数 x 是 偶数 ATMA FEE PN APS a aS, 而 a) b) 


乘 数 y 则 可 以 存放 在 任意 位 置 。 乘 法 结果 占据 了 整个 偶数 /图 8 两 个 = 地 址 代码 序列 
奇数 寄存 器 对 。 除 法 指令 的 形式 如 下 : 

Dx, y 
其 中 , 被 除数 占据 了 整个 偶数 /奇数 寄存 器 对 , x 是 其 中 的 偶 
数 号 寄存 器 ; 而 除数 是 y。 相 除 之 后 ,偶数 号 寄存 器 保存 余 
M, 而 奇数 号 寄存 器 保存 商 。 

现在 , 考虑 图 8-2 中 的 两 个 三 地 址 代码 序列 。 图 8-2a 和 
图 8-2b 之 间 的 唯一 差别 是 第 二 个 语句 的 运算 符 。 图 8:2a 和 
图 8-2b 对 应 的 最 短 汇编 代码 序列 如 图 8-3 所 示 。 ”图 83 最 优 机 器 代码 序列 
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Ri 表示 第 i 号 寄存 器 。SRDA HAR NARAH (Shift-Right-Double-Arithmetic) ; 而 SRDA RO 32 
把 被 除数 从 RO 中 移入 R1 并 把 RO 清空 , 使 得 所 有 位 都 等 于 被 除数 的 正 负 号 位 。L，ST 和 A 分 别 
表示 加 载 、 保 存 和 相 加 。 需 要 注意 的 是 , 把 a 加 载 到 哪个 寄存 器 的 最 优选 择 依赖 于 最 终 会 对 七 做 
什么 样 的 运算 。 加 

寄存 器 的 分 配 和 指派 的 策略 将 在 8. 8 节 讨 论 。8. 10 节 将 给 出 对 某 些 类 型 的 机 器 , 我 们 可 以 
构造 出 使 用 最 少 的 寄存 器 来 完成 表达 式 求 值 的 代码 序列 。 

8.1.5 求 值 顺序 

计算 执行 的 顺序 会 影响 目标 代码 的 效率 。 我 们 即将 看 到 , 相 比 其 他 的 计算 顺序 而 言 , 某 些 计 
算 顺 序 对 用 于 存放 中 间 结 果 的 寄存 器 的 需求 更 少 。 但 是 在 一 般 情况 下 ,找到 最 好 的 顺序 是 一 个 
困难 的 NP 完全 问题 。 一 开始 , 我 们 将 按照 中 间 代 码 生成 器 生成 代码 的 顺序 为 三 地 址 语句 生成 代 
码 , 从 而 暂时 如 开 这 个 问题 。 在 第 10 章 , 我 们 将 研究 对 流水 线 计 算 机 的 代码 排序 。 这 种 流水 线 
”计算 机 可 以 在 一 个 时 钟 周期 内 执行 多 个 运算 。 


8.2 目标 语言 


熟悉 目标 计算 机 及 其 指令 集 是 设计 一 个 优秀 代码 生成 器 的 前 担 。 为 了 给 某 个 目标 机 器 上 的 
一 个 完整 的 源 语 言 生成 高 质量 的 代码 , 我 们 需要 了 解 该 目标 机 的 许多 细节 。 焉 憾 的 是 , 在 对 代码 
生成 的 一 般 性 讨论 中 不 可 能 描述 出 全 部 的 细节 。 在 本 章 中 , 我 们 将 使 用 一 个 简单 计算 机 的 汇编 
代码 作为 目标 语言 。 这 个 计算 机 是 很 多 寄存 器 机 器 的 代表 。 然 而 , 本 章 中 描述 的 很 多 代码 生成 
技术 也 可 以 用 于 很 多 其 他 类 型 的 机 器 。 
8.2.1 一 个 简单 的 目标 机 模型 
我 们 的 目标 计算 机 是 一 个 三 地 址 机 器 的 模型 。 它 具有 加 载 和 保存 操作 、 计算 操作 、 跳 转 操 作 
和 条 件 跳 转 。 这 个 计算 机 的 内 存 按照 字 节 寻 址 , CAS 个 通用 寄存 器 RO0 ，R1，…， Rn-1, 一 
个 完整 的 汇编 语言 具有 几 十 到 上 百 个 指令 。 为 了 避免 因为 过 多 的 细节 而 妨碍 对 概念 的 解释 , 我 
们 将 只 使 用 一 个 很 有 限 的 指令 集合 , 并 假设 所 有 的 运算 分 量 都 是 整数 。 大 部 分 指令 包含 一 个 运 
算 符 ,然后 是 一 个 目标 地 址 ， 最 后 是 一 个 源 运 算 分 量 的 列表 。 指 令 之 前 可 能 有 一 个 标号 。 我 们 假 
设 有 如 下 种 类 的 指令 可 用 : . 
e 加 载运 算 : 指令 LD dst, addr 把 位 置 addr 上 的 值 加 载 到 位 置 ds; 。 这 个 指令 表示 赋值 dsi = 
addr。 这 个 指令 最 常见 的 形式 是 LD r, x。 它 把 位 置 % 中 的 值 加 载 到 寄存 器 r 中 。 形 如 LD 
ri, ry 的 指令 是 一 个 寄存 器 到 寄存 器 的 拷贝 运算 。 它 把 寄存 器 ,的 内 容 拷贝 到 寄存 名 
nth. 
o 保存 运算 : 指令 ST x,r 把 寄存 器 r 中 的 值 保存 到 位 置 x。 这 个 指令 表示 赋值 x=r。 
o 计算 运算 : 形 如 OP dst, sre, srca, 其 中 OP 是 一 个 诸如 ADD 或 SUB 的 运算 符 , 而 dst, sre 
All sre, 是 内 存 位 置 。 这 些 位 置 不 一 定 要 相互 不 同 。 这 个 机 器 指令 的 作用 是 把 OP 所 代表 
的 运算 作用 在 位 置 src, Al sre, 中 的 值 上 ,然后 把 这 次 运算 的 结果 放 到 位 置 dst 中 。 比 如 ， 
SUB ri, ra rs 计算 了 m =m -7r3。 原 先 存放 在 ri PREZAT, 但 是 如 果 7) 等 于 或 者 
nm， 计算 机 会 首先 读 出 原来 的 值 。 只 需要 一 个 运算 分 量 的 单 目 运算 符 没有 srez 
o 无 条 件 跳 转 : 指令 BR 了 上 使 得 控制 流转 向 标号 为 了 的 机 器 指令 。(BR 表示 产生 分 支 ) 。 
o 条 件 跳 转 : 该 指令 的 形式 为 Econd r, L, 其 中 7 是 一 个 寄存 器 ,上 是 一 个 标号 , 而 cond 代表 
了 对 寄存 器 7 中 的 值 所 做 的 茶 个 常见 测试 。 比 如 , 当 寄 存 器 r 中 的 值 小 于 0 时, BLTZ r, 了 
使 得 控制 流 跳 转 到 标号 L; 否则 , 控制 流传 递 到 下 一 个 机 器 指令 。 
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我 们 假设 目标 机 具有 多 种 寻 址 模式 : 

。 在 指令 中 , 一 个 位 置 可 以 是 一 个 变量 名 x, 它 指向 分 配给 x 的 内 存 位 置 ( 即 x 的 左 值 ) 。 

o 一 个 位 置 也 可 以 是 一 个 带 有 下 标的 形 如 a(7) 的 地 址 , 其 中 a 是 一 个 变量 ,而 上 是 一 个 寄 
存 器 。a(r) 所 表示 的 内 存 位 置 按照 如 下 方式 计算 得 到 : a 的 左 值 加 上 存放 在 寄存 器 r 中 的 
值 。 比 如 ， 指 令 LD RL1，a(R2) 的 效果 是 R1 = contents (a + contents (R2 ))， 其 中 
contents (x) RIR x 所 代表 的 寄存 器 或 内 存 位 置 中 存放 的 内 容 。 这 个 寻 址 方式 对 于 数组 访 
问 是 很 有 用 的 , 其 中 a 是 数组 的 基地 址 ( 即 第 一 个 元 素 的 地 址 ) ,而 r 中 存放 了 从 基地 址 
到 数组 a 的 某 个 元 素 所 要 经 过 的 字 节 数 。 

e 一 个 内 存 位 置 可 以 是 一 个 以 寄存 器 作为 下 标的 整数 。 比 如 , LD R1, 100(R2) 的 效果 就 是 
使 得 R1 =contents(100 +contents( R2))。 也 就 是 说 , 首先 计算 寄存 器 R 中 的 值 加 上 100 
得 到 的 和 , 然后 把 这 个 和 所 指向 的 位 置 中 的 值 加 载 到 R1 中 。 正 如 我 们 在 下 面 的 例子 中 
将 看 到 的 那样 ,这 个 寻 址 方式 可 以 用 于 沿 指针 取 值 。 l 

e 我 们 还 支持 另外 两 种 间接 寻 址 模式 : er 表示 在 寄存 器 7 的 内 容 所 表示 的 位 置 上 存放 的 
内 存 位 置 。 而 * 100(z) 表 示 在 上 中 内 容 加 上 100 的 和 所 代表 的 位 置 上 的 内 容 所 代表 的 
位 置 。 比 如 ，LD R1, * 100 (R2) 的 效果 是 把 RL 设置 为 contents (contents (100 + 
contents( R2 ) ) ) 。 也 就 是 说 , 首先 计算 寄存 器 R2 中 的 内 容 加 上 100 的 和 , 取出 和 值 所 指 
的 位 置 中 的 内 容 , 再 把 这 个 内 容 代 表 的 位 置 中 的 值 加 载 到 R1 中 。 

。 最 后 , 我 们 支持 一 个 直接 常数 寻 址 模式 。 在 常数 前 面 有 一 个 前 级 #。 指 令 LD R1， #100 把 
整数 100 加 载 到 R1 中 , 而 ADD R1, R1, #100 则 把 100 加 到 寄存 器 R 中 去 。 

在 指令 之 后 的 注解 由 // 开 头 。 
.三 地 址 语 旬 x =y -z 可 以 使 用 下 面 的 机 器 指令 序列 实现 ， 





LD Ri, y // Ri =y 
LD R2, z // R2 =z 
SUB R1, Ri, R2 // R1 = R1 - R2 
ST x, Ri // x= Ri 


也 许 我 们 能 做 得 更 好 。 一 个 优秀 的 代码 生成 算法 的 目标 之 一 是 尽 可 能 地 避免 使 用 上 面 的 全 
部 四 个 指令 。 比 如 , y MAR z 可 能 已 经 被 计算 出 来 并 存放 在 一 个 寄存 器 中 。 如 果 是 这 样 ， 我们 
就 可 以 避免 相应 的 LD 步 又。 类 似 地 , 如 果 x 的 值 被 使 用 时 都 存放 在 寄存 器 中 , 并 且 之 后 不 会 再 
被 用 到 , 我 们 就 不 需要 把 这 个 值 保存 回 x。 

假设 a 是 一 个 元 素 为 8 字 节 值 ( 比如 实数 ) 的 数组 。 再 假设 a 的 元 素 的 下 标 从 0 开始 。 我 们 
可 以 通过 下 面 的 指令 序列 来 执行 三 地 址 指令 b =a[i] : 


LD Ri, i // RL ei 

MUL R1, R1, 8 // Rl = R1 * 8 

LD R2, a(R1) // R2 = contents(a + contents(R1)) 
ST b, R2 ` // b= R2 


这 里 的 第 二 步 计算 8i; 而 第 三 步 把 a 的 第 i 个 元 素 的 值 放 到 R2 中 , 这 个 元 素 位 于 离 数 组 a 
的 基地 址 8 个 字 节 的 地 方 。 
类 似 地 , 三 地 址 指令 ali] =c 所 代表 的 对 数组 a 的 赋值 可 以 实现 为 : 


LD Ri,c // RL =c 

LD R2, j // R2 = j 

MUL R2, R2, 8 // R2 =R2* 8 

ST a(R2), R1 // contents(a + contents(R2)) = R1 


为 了 实现 一 个 简单 的 指针 间接 存 取 ,比如 三 地 址 语句 x = * p, 我 们 可 以 使 用 如 下 的 机 器 指 
令 序列 ; 
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LD Ri, p // RL =p 

LD R2, O(R1) // R2 = contents(0 + contents(R1)) 

ST x, R2 // x = R2 

通过 指针 的 赋值 语句 * p =y 可 以 类 似 地 用 如 下 的 机 器 代码 实现 ; 
LD Ri, p // Ri =p 

LD R2, y // R2=y 

ST 0(R1), R2 // contents(0 + contents(R1)) = R2 


最 后 考虑 一 个 带 条件 跳 转 的 三 地 址 指令 : 


if x < y goto L 


它 的 等 价 的 机 器 代码 如 下 : 
LD R1, x // RL =x 
LD R2, y // R2 = y 
SUB R1, Ri, R2 // Ri = Ri - R2 
BLTZ R1, M // if Ri< 0 jump to M 


这 里 的 M 是 从 标号 为 工 的 三 地 址 指令 所 产生 的 机 器 指令 序列 中 的 第 一 个 指令 的 标号 。 对 于 
任意 一 个 三 地 址 指令 , 我 们 希望 可 以 省 略 这 些 指令 中 的 某 些 指令 。 省 略 的 原因 可 能 是 所 需 的 运 
算 分 量 已 经 在 寄存 器 中 了 , 也 可 能 因为 结果 不 需要 存放 回 内 存 。 口 
8.2.2 程序 和 指令 的 代价 | 
我 们 经 常会 指出 编译 及 运行 一 个 程序 所 需 的 代价 。 根 据 我 们 在 优化 一 个 程序 时 感 兴趣 的 方面 , 我 
们 会 使 用 不 同 的 度量 。 常 用 的 度量 包括 编译 时 间 的 长 短 , 以 及 目标 程序 的 大 小 、 运 行 时 间 和 能 耗 。 
确定 编译 和 运行 一 个 程序 的 实际 代价 是 一 个 复杂 的 问题 。 总 的 来 说 , 为 一 个 给 定 的 源 程 序 
找到 一 个 最 优 的 目标 程序 是 一 个 不 可 判定 问题 ， 而 很 多 相关 的 子 问题 都 是 NP 困难 的 。 正 如 我 们 
已 经 指出 的 , 在 代码 生成 时 , 我 们 通常 必须 满足 于 那些 能 够 生成 优良 代码 但 不 一 定 是 最 优 目 标 程 
序 的 启发 式 技术 。 
在 本 章 的 其 余部 分 , 我 们 将 假设 每 个 目标 语言 指令 都 有 相应 的 代价 。 为 简单 起 见 , 我 们 把 一 
个 指令 的 代价 设 定 为 1 加 上 与 运算 分 量 寻 址 模式 相关 的 代价 。 这 个 代价 对 应 于 指令 中 字 的 长 度 。 
寄存 器 寻 址 模式 具有 的 附加 代价 为 0, 而 涉及 内 存 位置 或 常数 的 寻 址 方式 的 附加 代价 为 1。 下 面 
是 一 些 例子 : 
e 指令 LD RO, R1 把 寄存 器 R1 中 的 内 容 拷贝 到 寄存 器 RO 中 。 因 为 不 要 求 附加 的 内 存 字 ， 
所 以 这 个 指令 的 代价 是 1。 

e 指令 LD R0, M 把 内 存 位 置 X 中 的 内 容 加 载 到 寄存 器 RO 中 。 指 令 的 代价 是 2, 因为 内 存 
ME M 的 地 址 在 紧 跟 着 指令 的 字 中 。 

e 指令 LD RE1，*100(R2) 把 值 contents (contents(100 + contents( R2))) 加 载 到 寄存 器 RL 
中 。 这 个 指令 的 代价 是 2, 因为 常数 100 存放 在 紧 跟着 指令 的 内 存 字 中 。 

在 本 章 中 , 我 们 假设 对 于 一 个 指定 的 输入 , 目标 语言 程序 的 代价 是 当 此 程序 在 该 输入 上 运行 
时 所 执行 的 所 有 指令 的 代价 总 和 。 优 秀 的 代码 生成 算法 的 目标 是 使 得 程序 在 典型 输入 上 运行 时 
所 执行 指令 的 代价 总 和 最 小 。 我 们 将 会 看 到 , 在 某 些 情况 下 , 我 们 真 的 能 够 在 某 些 类 型 的 寄存 器 
机 器 上 为 表达 式 生成 最 优 的 代码 。 

8.2.3 8.2 节 的 练习 

练习 8. 2. 1: 假设 所 有 的 变量 都 存放 在 内 存 中 , 为 下 面 的 三 地 址 语句 生成 代码 : 

1)x=1i 

2 x=a 

3)x=a+i 

4)x=at+d 

5) 两 个 语句 的 序列 


代码 生成 223 





b*c 
atx 


x 
y 


练习 8.2.2: 假设 a 和 "是 元 素 为 4 字 节 值 的 数组 , 为 下 面 的 三 地 址 语句 序列 生成 代码 。 
1) 四 个 语句 的 序列 


2) 三 个 语句 的 序列 
= ali] 

y = b[i] 
=x * y 

3) 三 个 语句 的 序列 

x = a[i] 

y= bk] 

ali] = y 

练习 8. 2. 3: 假设 p 和 <a 存放 在 内 存 位 置 中 , 为 下 面 的 三 地 址 语句 序列 生成 代码 : 

y = tq 

gq +4 

*p =y 

p=p+4 

练习 8.2.4: 假设 x、y Az 存放 在 内 存 位置 中 , 为 下 面 的 语句 序列 生成 代码 : 


if x < y goto Li 


z=0 
goto L2 
EDLs 2-5 1 
练习 8.2.5: 假设 ”在 一 个 内 存 位 置 中 , 为 下 面 的 语句 序列 生成 代码 : 
s=0 
i=0 


Li: if i > n goto L2 
s=st+i 
i=i+1 
goto Li 

L2: 

练习 8.2.6: 确定 下 列 指令 序列 的 代价 。 

1) LD RO, y : 
LD Ri, z 
ADD RO, RO, R1 
ST x, RO 

2) LD RO, i 
MUL RO, RO, 8 
LD Ri, a(RO) 

ST b, Ri 

3) LD RO, c 
LD R1, i 
MUL R1, R1, 8 
ST a(Ri), RO 

4) LD RO, p 
LD Ri, O(RO) 

ST x, Ri 

5) LD RO, p 
LD Ri, x 
ST O(RO), Ri 

6) LD RO, x 
LD Ri, y 
SUB RO, RO, Ri 
BLTZ *R3, RO 
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8.3 目标 代码 中 的 地 址 


在 本 节 中 ,我们 将 说 明 如 何 使 用 静态 和 栈 式 内 存 分 配 为 简单 的 过 程 调用 和 返回 生成 代码 ， 以 
此 将 I 中 的 名 字 转 换 成 为 目标 代码 中 的 地 址 。 在 7.1 节 中 , 我 们 描述 了 每 个 正在 执行 的 程序 是 
如 何在 它 的 收 辑 地 址 空间 上 运行 的 。 这 个 空间 被 划分 成 为 四 个 代码 及 数据 区 域 : 

1) 一 个 静态 确定 的 代码 区 Code。 这 个 区 存放 可 执行 的 目标 代码 。 目 标 代 码 的 大 小 可 以 在 编 
译 时 刻 确定 。 

2) 一 个 静态 确定 的 静态 数据 区 Static。 这 个 区 存放 全 局 常量 和 编译 器 生成 的 其 他 数据 。 全 
局 常量 和 编译 器 数据 的 大 小 也 可 以 在 编译 时 刻 确 定 。 

3) 一 -个 动态 管理 的 堆 区 Heap。 这 个 区 存放 程序 运行 时 刻 分 配 和 释放 的 数据 对 象 。Heap 的 大 
小 不 能 在 编译 时 刻 静 态 确 定 。 

4) 一 个 动态 管理 的 栈 区 Stack。 这 个 区 存放 过 程 的 活动 记录 。 活 动 记录 会 随 着 过 程 的 调用 和 
返回 被 创建 和 消除 。 和 堆 区 一 样 , 栈 区 的 大 小 也 不 能 在 编译 时 刻 确定 。 

8. 3.1 静态 分 配 
为 了 说 明 人 简化 的 过 程 调用 和 返回 的 代码 生成 , 我 们 关注 下 面 的 三 地 址 语句 : 
e call callee 
e return 
e halt 
e action, 这 是 代表 其 他 三 地 址 语句 的 占 位 符 。 

活动 记录 的 大 小 和 布局 是 由 代码 生成 器 通过 存放 于 符号 表 中 的 名 字 的 信息 来 确定 的 。 我 们 
将 首先 说 明 如 何在 过 程 调用 时 在 一 个 活动 记录 中 存放 返回 地 址 ,以 及 如 何在 过 程 调用 结束 后 把 
控制 返回 到 这 个 地 址 。 为 方便 起 见 , 我 们 假设 活动 记录 的 第 一 个 位 置 存放 返回 地 址 。 

我 们 首先 考虑 实现 最 简单 情况 ( 即 静 态 分 配 ) 时 的 代码 。 这 里 ， 中间 代码 中 的 call callee 语 
名 可 以 用 包含 两 个 目标 机 指令 的 序列 来 实现 : 


ST callee.staticArea, #here + 20 
BR callee.codeArea 


ST 指令 把 返回 地 址 保存 到 callee 的 活动 记录 的 开始 处 , 而 BR 把 控制 传递 到 被 调用 过 程 callee 的 
目标 代码 上 。 属 性 callee. staticArea 是 一 个 常量 , 给 出 了 callee 的 活动 记录 的 开始 处 的 地 址 , 而 属 
性 callee. codeArea 也 是 一 个 常量 , 指向 运行 时 刻 内 存 中 Code 区 中 被 调用 过 程 callee 的 第 一 个 指令 
的 地 址 。 

ST 指令 中 的 运算 分 量 关 ere +20 是 返回 地 址 的 文字 表示 , 它 是 紧 跟 在 BR 指令 之 后 的 指令 的 
地 址 。 我 们 假设 zere 是 当前 指令 的 地 址 , 而 调用 序列 中 的 三 个 常量 加 上 两 个 指令 的 长 度 为 5 个 
字 , 即 20 个 字 节 。 

过 程 代码 的 结尾 处 是 一 个 返回 到 调用 者 过 程 的 指令 。 但 是 没有 调用 者 的 第 一 个 过 程 例外 ， 
它 的 最 后 一 个 指令 是 HALT。 这 个 指令 把 控制 返回 给 操作 系统 。 一 个 return 语 句 可 以 使 用 一 个 
简单 的 跳 转 语句 实现 : 

BR *callee.staticArea 
它 把 控制 流转 到 保存 在 callee 的 活动 记录 开始 位 置 的 地 址 上 。 

RS 假设 我 们 有 下 面 的 三 地 址 代码 : 
//c 的 代码 


action; 
call p 
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actions 
halt 
// p 的 代码 
actions 
return 


图 8-4 给 出 了 这 个 三 地 址 代码 的 目标 程序 。 我 们 使 用 伪 指 令 ACTION 来 代表 执行 语句 


过 程 c 的 代码 从 地 址 100 开始 , 而 过 程 p 从 地 址 200 开始 。 我 们 假定 每 个 ACTION 伪 指 令 占 用 
20 个 字 节 。 我 们 还 假定 这 些 过 程 的 活动 记录 以 静态 方式 分 配 ， 甚 位置 分 别 是 300 和 364。 





// c 的 代码 
100: ACTION, // action, 的 代码 
120: ST 364, #140 // 在 位 置 364 上 存放 返回 地 址 140 
132: BR 200 // 调用 忆 
140: ACTION? 





160: HALT // 返回 操作 系统 
// PP 的 代码 

200: ACTION; 

220: BR *364 // 返回 在 位 置 364 保存 的 地 址 处 


// 300-363 存 放 * 的 活动 记录 


300: // 返回 地 址 
304: // “的 局 部 数据 
// 364-451 存 放 P 的 活动 记录 
364: // 返回 地 址 
368: // P 的 局 部 数据 

















图 8-4 ”静态 分 配 的 目标 代码 

从 地 址 100 开始 的 指令 实现 了 过 程 c 的 语句 : 

actioni; call p; actiony; halt 
因此 程序 的 运行 从 地 址 100 上 的 指令 ACTION, 开始 。 在 地 址 120 上 的 ST 指令 把 返回 地 址 140 
存放 在 机 器 状态 字段 中 , 也 就 是 p 的 活动 记录 的 第 一 个 字 中 。 在 地 址 132 上 的 BR 指令 把 控制 转 
移 到 被 调用 过 程 p 的 目标 代码 的 第 一 个 指令 。 

执行 了 ACTION, 之 后 , 位 于 地 址 220 的 跳 转 指令 被 执行 。 因 为 上 面 的 调用 代码 序列 把 位 置 
140 存放 在 地 址 364 中 , 因此 当 位 于 地 址 220 的 BR 语句 执行 时 ，* 364 代表 140。 所 以 当 过 程 p 
结束 时 ,控制 流 返回 到 地 址 140, 过 程 c 继续 执行 。 
8.3.2 ROM 

如 果 在 保存 活动 记录 时 使 用 相对 地 址 , 静态 分 配 就 可 以 变 成 栈 分 配 。 但 是 在 栈 分 配方 式 中 ， 
只 有 等 到 运行 时 刻 才 能 知道 一 个 过 程 的 活动 记录 的 位 置 。 这 个 位 置 通常 存放 在 一 个 寄存 器 里 面 ， 
因此 活动 记录 中 的 字 可 以 通过 相对 于 寄存 器 中 值 的 偏 移 量 来 访问 。 我 们 的 目标 机 的 下 标 地 址 模 
式 可 以 方便 地 完成 这 种 访问 。 

正如 我 们 在 第 7 章 中 已 经 看 到 的 , 活动 记录 的 相对 地 址 可 以 用 相对 于 活动 记录 中 的 任 一 已 知 
位 置 的 偏 移 量 来 表示 。 为 方便 起 见 , 我 们 将 在 寄存 器 SP 中 维护 一 个 指向 栈 顶 的 活动 记录 的 开始 
处 的 指针 ,这 样 就 可 以 使 所 有 的 偏 移 量 都 是 正 数 。 当 发 生 过 程 调用 时 , 调用 过 程 增 加 Se 的 值 ， 
并 把 控制 传递 到 被 调用 过 程 。 在 控制 返回 到 调用 者 时 , 我 们 减少 SP 的 值 ,从 而 释放 被 调用 过 程 
的 活动 记录 。 

第 一 个 过 程 的 代码 把 SP 设置 成 内 存 中 栈 区 的 开始 位 置 , 完成 对 栈 的 初始 化 : 
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LD SP, #stackStart // 初始 化 栈 
code for the first procedure 
HALT // 结束 执行 
一 个 过 程 调用 指令 序列 增加 SP 的 值 , 保存 返回 地 址 , 并 把 控制 传递 到 被 调用 过 程 : 
ADD SP, SP, #caller.recordSize // 增加 栈 指针 
ST 0(SP)，#jhere 十 16 // 保存 返回 地 址 
BR callee.codeArea // 转移 到 被 调用 过 程 


运算 分 量 #caller. recordSize 表示 一 个 活动 记录 的 大 小 , 因此 ADD 指令 使 得 SP 指向 下 一 个 活动 记 
Ko TE ST 指令 中 的 运算 分 量 #fhere + 16 是 跟随 在 BR 之 后 的 指令 的 地 址 ， 它 被 存放 在 SP 所 指向 














的 地 址 中 。 
返回 指令 序列 包含 两 个 部 分 。 被 调用 过 程 使 用 下 面 的 指令 把 控制 传递 到 返回 地 址 : 
BR *0(SP) // 返回 给 调用 者 [Op me ges | 
在 BR 中 使 用 * 0( SP) 的 原因 是 我 们 需要 两 层 间 接 寻 址 : | action, 
0(SP) 是 活动 记录 的 第 一 个 字 所 在 的 位 置 , 而 * 0(SP) 是 存 | ca a 
放 在 那里 的 返回 地 址 。 halt 
返回 指令 序列 的 第 二 部 分 在 调用 者 中 ,这 个 序列 减少 ev RO 
Seas eee ee return 2 
算 之 后 ，sp 指向 调用 者 的 活动 记录 的 开始 处 ， TR ee 
SUB SP, SP, #caller.recordSize // 栈 指针 减 ! call p 
第 7 章 中 包含 了 有 关 调 用 指令 序列 以 及 在 调用 过 程 和 被 。 | 2 0 
调用 过 程 之 间 进 行 任务 分 配 的 折 事 方案 的 更 广泛 的 讨论 。 actiong 
图 8-5 中 的 程序 是 前 一 章 中 的 快速 排序 程序 的 -| etar 
个 抽象 。 过 程 是 递归 的 , 因此 在 同一 时 刻 可 能 有 多 个 活 唉 ae 
的 4 的 活动 记录 。 人 


假设 过 程 m、p 和 a 的 活动 记录 的 大 小 已 经 确定 , 分 别 是 msize、psize 和 gsize。 每 个 活动 记录 
的 第 一 个 字 存 放 返 回 地 址 。 我 们 随意 地 假设 这 些 过 程 的 代码 分 别 从 地 址 100、200 和 300 处 开始 ， 
并 假设 栈 区 在 地 址 600 处 开始 。 目 标 程序 在 图 8-6 中 显示 。 





// a 的 代码 
100: LD SP, #600 // 初始 化 栈 
108: ACTION; // action 的 代码 
128: ADD SP, SP, #msize // 调用 指令 序列 的 开始 
136: ST O(SP), #152 // B EHHE AE 
144: BR 300 // 调用 q 


152: SUB SP, SP, #msize // 恢复 SP 的 值 
160: ACTION, 





180: HALT 
// P 的 代码 
200: ACTION 
220: BR *0(SP) // 返回 
// 4 的 代码 
300: ACTION, // 包含 有 跳 转 到 456 的 条 件 转移 指令 
320: ADD SP, SP, #qsize 
328: ST O(SP), #344 // 将 返回 地 址 压 人 栈 
336: BR 200 // 调用 P 
344: SUB SP, SP, #gsize 
352: ACTIONS 











图 8-6 栈 式 分 配 时 的 目标 代码 
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372: ADD SP, SP, #gsize 

380: BR O(SP), #396 /7/ MeV EL SHE EAE 
388: BR 300 // 调用 aq 

396: SUB SP, SP, #gsize 

404: ACTION, 

424: ADD SP, SP, #gsize 


432: ST O(SP), #440 // 将 返回 地 扯 讨 人 和 
440: BR 300 // 调用 

448: SUB SP, SP, #gszze 

456: BR *0(SP) // 返回 

600: // 栈 区 的 开始 处 











图 8-6 (28) 


我 们 假设 ACTION, 包含 了 一 个 条 件 跳 转 指令 , 跳 转 到 a 的 返回 代码 序列 开始 地 址 456; 否 
则 , 递归 过 程 a 将 不 得 不 永远 调用 自己 。 

& msize 、psize 和 qsize 分 别 是 20、40 和 60。 在 地 址 100 处 的 第 一 个 指令 把 SP 初始 化 为 600, 
即 栈 区 的 开始 地 址 。 在 控制 从 nn 转向 a 的 前 一 刻 ，SP 中 的 值 是 620( 因为 msize 为 20)。 随 后 当 a 
调用 p 时 , 在 地 址 320 处 的 指令 把 SP 增加 到 680, BI o 的 活动 记录 的 开始 处 ; 当 控 制 返回 到 a 的 
时 候 ，SP 回复 到 620。 如 果 接 下 来 的 两 个 对 a 的 递归 调用 立刻 返回 , 那么 执行 过 程 中 SP 的 最 大 
值 就 是 680。 但 是 请 注意 , 栈 区 中 被 使 用 的 最 后 的 位 置 是 739， 因为 从 位 置 680 开始 的 a 的 活动 
记录 总 共有 60 个 字 节 。 CJ 
8. 3. 3 名字 的 运行 时 刻 地 址 

存储 分 配 策略 以 及 过 程 的 活动 记录 中 局 部 数据 的 布局 决定 了 如 何 访问 名 字 对 应 的 内 存 位 置 。 
在 第 6 章 , 我 们 假设 一 个 三 地 址 语句 中 的 名 字 实 际 上 是 一 个 指向 该 名 字 的 符号 表 条 目的 指针 。 这 
个 方法 有 一 个 极 大 的 好 处 ， 它 使 得 编译 器 更 加 易于 移植 , 因为 即使 当 编译 器 被 移植 到 使 用 不 同 运 
行 时 刻 组 织 方式 的 其 他 机 器 时 ,其 前 端 也 不 需要 修改 。 但 是 从 另 一 个 方面 来 看 , 在 生成 中 间 代 码 
时 生成 特定 的 访问 步骤 对 于 一 个 优化 编译 器 也 有 极 大 的 好 处 ， 因 为 这 使 得 优化 器 能 够 利用 原本 
在 简单 的 三 地 址 语句 中 不 可 见 的 细节 。 

在 任何 一 种 情况 下 ,名 字 最 终 必 须 被 蔡 代 为 访问 存储 位 置 的 代码 。 在 这 里 , 我 们 考虑 简单 的 
三 地 址 拷贝 语句 x =0 的 一 些 细节 。 假 设 在 处 理 完 一 个 过 程 的 声明 部 分 后 , x 的 符号 表 条 目 包含 
了 x 的 相对 地 址 12。 如 果 x 被 分 配 在 一 个 从 地 址 static 开始 的 静态 分 配 区 域 中 , 那么 x 的 实际 运 
行 时 刻 地 址 是 static + 12。 虽 然 编译 器 最 终 可 以 在 编译 时 刻 确 定 static +12 的 值 , 但 是 在 生成 访问 
该 名 字 的 中 间 代 码 时 可 能 还 不 知道 静态 区 域 的 位 置 。 在 这 种 情况 下 , 生成 “计算 ”static +12 的 三 
地 址 代码 是 有 意义 的 。 当 然 我 们 要 理解 , 这 个 计算 在 程序 运行 之 前 就 会 完成 : 它 或 者 在 代码 生成 
阶段 完成 ,或 者 由 加 载 器 完成 。 那 么 ,赋值 语句 x =0 被 翻译 成 

static[12] = 0 
如 果 静 态 区 从 地 址 100 开始 , 这 个 语句 的 目标 代码 是 

LD 112, #0 
8.3.4 8.3 节 的 练习 

练习 8. 3. 1: 假设 使 用 栈 式 分 配 而 寄存 器 SP 指向 栈 的 顶端 , 为 下 列 的 三 地 址 语句 生成 代码 。 

a 

return 

call r 


return 
return 
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练习 8. 3.2: 假设 使 用 栈 式 分 配 而 寄存 器 SP 指向 栈 的 顶端 , 为 下 列 的 三 地 址 语句 生成 代码 。 
1)x=1 
2)x=a 
3)x=ati 
4)x=a+b 
5 ) 两 个 语句 的 序列 
x=bxee 
y=a+x 


练习 8. 3. 3: 假设 使 用 栈 式 分 配 ,， 且 假设 a 和 bb 都 是 元 素 大 小 为 4 字 节 的 数组 , 再 次 为 下 面 
的 三 地 址 语句 生成 代码 。 

1) 四 个 语句 的 序列 

x = ali] 

y = b[j] 

ali] = y 

bij] =x 

2) 三 个 语句 的 序列 

x = ali] 

y = b[i] 

Z2=x*y 


3) 三 个 语句 的 序列 
x = afi] 
y = bix] 
ali] = y 


8.4 基本 块 和 流 图 

本 节 介 绍 一 种 用 图 来 表示 中 间 代 码 的 方法 。 即 使 这 个 图 没有 显 式 地 被 代码 生成 算法 生成 ， 
它 对 于 讨论 代码 生成 也 是 有 帮助 的 。 上 下 文 信息 有 助 于 更 好 地 生成 代码 。 正 如 我 们 将 在 8. 8 节 
看 到 的 ,如果 我 们 知道 程序 中 的 值 是 如 何 被 定 值 和 使 用 的 , 我 们 就 可 以 更 好 地 分 配 寄 存 器 。 我 们 
还 将 在 8. 9 节 看 到 , 通过 检查 三 地 址 语句 序列 , 我 们 可 以 更 好 地 完成 指令 选择 工作 。 

这 个 表示 方法 可 以 按照 如 下 方法 构造 : 

1) 把 中 间 代 码 划 分 成 为 基本 块 (basic block)。 每 个 基本 块 是 满足 下 列 条 件 的 最 大 的 连续 三 
地 址 指令 序列 。 

O 控制 流 只 能 从 基本 块 中 的 第 一 个 指令 进入 该 块 。 也 就 是 说 , 没有 跳 转 到 基本 块 中 间 的 转 
移 指令 。 

O 除了 基本 块 的 最 后 一 个 指令 , 控制 流 在 离开 其 本 块 之 前 不 会 停机 或 者 跳 转 。 

2) 基本 块 形成 了 流 图 (flow graph) 的 结 点 。 而 流 图 的 边 指 明了 哪些 基本 块 可 能 紧 随 一 个 基本 
块 之 后 运行 。 

从 第 9 章 开 始 , 我 们 将 讨论 在 流 图 上 的 多 种 转换 。 这 些 转 换 把 原 有 的 中 间 代 码 转换 成 为 “ 优 
化 后 ”的 中 间 代 码 , 而 从 “优化 后 ”的 中 间 代 码 可 以 生成 更 好 的 目标 代码 。 将 “优化 后 "的 中 间 代 
码 转换 为 目标 机 器 代码 的 工作 将 使 用 本 章 中 的 代码 生成 技术 完成 。 





中 断 的 影响 
有 人 认为 ,只 要 控制 流 到 达 基 本 块 的 开始 处 就 必然 会 继续 执行 到 基本 抉 结束 处 , 但 是 这 
个 说 法 需要 一 些 仔 细 的 考虑 。 有 很 多 原因 会 导致 一 个 中 断 使 得 控制 流离 开 基 本 块 , 甚至 可 能 
不 再 返回 , 但 这 些 中 断 并 没有 在 代码 中 显 式 地 反映 出 来 。 比 如 , 一 个 像 x =y 2 这 样 的 指令 
看 起 来 不 影响 控制 流 。 但 是 如 果 z 是 0, 此 指令 实际 上 可 能 使 程序 异常 中 止 。 
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我 们 用 不 着 担心 这 种 可 能 性 。 ET HMT: 构造 基本 块 的 目的 是 m 化 代码 。 一 般 来 说 ， 当 
一 个 中 断 发 生 时 , 它 要 么 被 适当 处 理 然后 将 控制 返回 到 引起 中 断 的 指令 , 就 好 像 控 制 流 从 来 
没有 离开 过 ; 要 么 程序 会 中 止 并 报错 。 在 后 一 种 情况 下 ， 即 使 我 们 在 优 化 时 假设 控制 流 会 一 
直到 达 基 本 块 的 结尾 , 优化 的 结果 也 不 会 有 错 ， 因 为 条 BPA 就 个 会 给 1 1 预计 的 结果 。 








8.4.1 基本 块 

我 们 的 第 一 项 工作 是 把 一 个 三 地 址 指 4 SR 我 们 以 第 一 个 指令 作为 一 个 
新 基本 块 的 开始 , 然后 不 断 把 后 续 的 指令 加 进去 ， 直到 我 们 碰 到 一 个 无 条 件 跳 转 、 条 件 跳 转 指令 
或 者 下 一 个 指令 前 面 的 标号 为 卜 。 当 没有 跳 转 和 标号 时 ， E 个 指令 到 达 下 一 个 指 
令 。 这 个 想法 在 下 面 的 算法 中 形式 化 地 表示 出 来 。 








Paes) 把 三 地 址 指令 序列 划分 成 为 基本 块 。 hae 
输入 : 一 个 三 地 址 指令 序列 。 E Saree 
输出 : 输入 序列 对 应 的 一 个 基本 抉 列表 , 其 中 每 个 指令 4) t2= tl+j 
恰好 被 分 配给 一 个 基本 块 。 i eee 


方法 : 首先 , 我 们 确定 中 间 代 码 序列 中 哪些 指令 是 首 指 DSA > O30 
令 (leader) , 即 某 个 基本 块 的 第 一 个 指令 。 跟 在 中 间 程 序 末 By de fee eto ead 
端 之 后 的 指令 的 不 包含 在 首 指令 集合 中 。 选 择 首 指令 的 规则 10) i-ivd 
11) if i <= 10 goto (2) 
如 下 : 12) i=1 

1) 中 间 代 码 的 第 一 个 三 地 址 指令 是 一 个 首 指令 。 A ae We 


2) 任意 一 个 条 件 或 无 条 件 转移 指令 的 目标 指令 是 一 个 15) a(t6] = 1.0 




















首 指令 。 16) i=i+i 
17) if i <= 10 goto (13) 
3) 紧 跟 在 一 个 条 件 或 无 条 件 转移 指令 之 后 的 指令 是 一 
个 首 指令 。 图 8-7 把 一 个 10 x 10 的 矩阵 
然后 , 每 个 首 指令 对 应 的 基本 块 包括 了 从 它 自己 开始 ， 设置 成 单位 矩阵 的 中 间 代 码 
a a a 直 尾 指令 之 间 的 
所 有 指令 。 口 for j from 1 to 10 do 
图 8-7 中 的 中 间 代码 把 一 个 10 x10 的 矩阵 a 设置 gs rom 1 eo 
成 一 个 单位 矩阵 。 这 段 代码 来 自 娜 里 并 不 重要 , 它 也 许 是 从 | ali =; 








图 8-8 的 伪 代 码 中 翻译 得 到 的 。 在 生成 这 个 中 间 代 码 的 时 
z, 我 们 假设 每 一 个 实数 值 的 数组 元 素 占 8 个 字 节 ， 且 和 矩阵 
a 按 行 存放 。 

首先 , 根据 算法 8. 5 的 规则 (1) 可 知 第 一 个 指令 是 一 个 首 指 令 。 为 了 找到 其 他 的 首 指令 , 我 
们 要 找到 跳 转 指令 。 在 这 个 例子 中 有 三 个 跳 转 指令 (全 部 是 条 件 跳 转 指令 ) ,， 即 指令 9、11 和 17。 
根据 规则 (2), 这 些 跳 转 指令 的 目标 是 首 指令 , 它们 分 别 是 指令 3、2 和 13 。 然 后 , 根据 规则 (3 ) ， 
跟 在 一 个 跳 转 指令 后 面 的 每 个 指令 都 是 首 指令 , 即 指令 10 和 12。 注 意 , 在 这 段 代 码 里 没有 跟 在 
HO 17 后 面 的 指令 。 假 如 有 的 话 , 那么 第 18 个 指令 也 是 一 个 首 指令 。 

我 们 可 以 得 出 结论 : 指令 1、2、3、10、12 和 13 是 首 指令 。 每 个 首 指令 对 应 的 基本 块 包括 了 
从 它 开 始 直到 下 一 个 首 指 令 之 前 的 所 有 指令 。 因 此 , 指令 1 的 基本 块 就 是 指令 1, 指令 2 的 基本 
块 是 指令 2。 但 首 指令 3 的 基本 块 包含 了 从 指令 3 到 指令 9 的 所 有 指令 。 指 令 10 的 基本 块 是 10 
和 11; 指令 12 的 基本 块 仅仅 包含 指令 12, 而 指令 13 的 基本 块 是 指令 13 到 17。 口 


图 8-8 图 8-7 的 源 代 码 
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8.4.2 ”后 续 使 用 信息 

知道 一 个 变量 的 值 接 下 来 会 在 什么 时 候 使 用 对 于 生成 良好 的 代码 是 非常 重要 的 。 如 果 一 个 
变量 的 值 当前 存放 在 一 个 寄存 器 中 , 县 之 后 一 直 不 会 被 使 用 , 那么 这 个 寄存 器 就 可 以 被 分 派 给 另 
一 个 变量 。 

在 一 个 三 地 址 语句 中 对 一 个 名 字 的 使 用 (use) 的 定义 如 下 。 假 设 三 地 址 语句 i 给 x 赋 了 一 
值 。 如 果 语 句 j 的 一 个 运算 分 量 为 x, 并 且 从 语句 i 开始 可 以 通过 未 对 x 进行 赋值 的 路 径 ae 
j, 那么 我 们 说 语句 j 使 用 了 在 语句 i 处 计算 得 到 的 x 的 值 。 我们 可 以 进一步 说 x 在 语句 i 处 活跃 
(live) 。 

对 每 个 类 似 于 x =y+z 的 三 地 址 语句 ,我 们 希望 确定 对 x、y 和 z 的 下 -一 次 使 用 是 什么 。 当 前 
我 们 不 考虑 在 包含 本 三 地 址 语句 的 基本 块 之 外 的 使 用 。 

我 们 用 来 确定 活跃 性 和 后 续 使 用 信息 的 算法 对 每 个 基本 块 进行 一 次 反 向 的 遍历 。 我 们 把 得 
到 的 信息 存放 到 符号 表 中 。 使 用 算法 8. 5 中 给 出 的 方法 , 我 们 可 以 很 容易 地 通过 扫描 一 个 三 地 址 
语句 流 找到 各 个 基本 块 的 结尾 。 因 为 过 程 可 能 有 副作用 ,为 方便 起 见 ,我们 假设 每 一 个 过 程 调用 
指令 是 一 个 新 的 基本 块 的 开始 。 
arg) 对 一 个 基本 块 中 的 每 一 个 语句 确定 活跃 性 与 后 续 使 用 信息 

De a aa 
量 都 是 活跃 的 。 

输出 ; 对 于 B 的 每 一 个 语句 i x=y+z, 我 们 将 x*、y 及 z 的 活跃 性 信息 及 后 续 使 用 信息 关联 
Bll ig 

方法 ; 我 们 从 B 的 最 后 一 个 语句 开始 , 反 向 扫描 到 B 的 开始 处 。 对 于 每 个 语句 i x ay +z, 
我 们 做 下 面 的 处 理 : 

1) 把 在 符号 表 中 找到 的 有 关 x、y 和 z 的 当 前 后 续 使 用 和 活 牙 性 信息 与 语句 ; 关联 起 来 。 

2) 在 符号 表 中 , 设置 x 为 “不 活跃 "和 “无 后 续 使 用 ”。 

3) 在 符号 表 中 , 设置 y 与 z 为 "活跃 "， 并 把 它们 的 下 一 次 使 用 设置 为 语句 让 

ERE, 我 们 使 用 + 作为 代表 任意 运算 符 的 符号 。 如 果 三 地 址 语句 i 形 如 x = +y 或 者 x=y， 
那么 处 理 步 又 依然 和 上 面相 同 , 只 是 忽略 了 对 z 的 处 理 。 注 意 , 步 又 (2) 和 步骤 (3 ) 的 顺序 不 能 颠 








倒 , 因为 4 可 能 就 是 y RA zo 口 
8.4.3 流 图 

当 将 一 个 中 间 代 码 程 序 划 分 成 为 基本 块 之 后 , 我 们 用 一 个 流 图 来 表示 它们 之 间 的 控制 流 。 
流 图 点 就 是 这 些 基 本 块 。 从 基本 块 恕 到 基本 块 C 之 间 有 一 条 边 当 且 仅 当 基本 块 C 的 第 一 个 


指令 可 能 紧 跟 在 B 的 最 后 一 个 指令 之 后 执行 。 存 在 这 样 一 条 边 的 原因 有 两 种 : 
e -个 从 8 的 结尾 跳 转 到 C 的 开头 的 条 件 或 无 条 件 跳 转 语句 。 
o 按照 原来 的 三 地 址 语句 序列 中 的 顺序 , C 紧 跟 在 8 之 后 , 且 B 的 结尾 不 存在 无 条 件 跳 转 
语句 。 
我 们 说 BB 是 C 的 前 驱 (predecessor), 而 C 是 B 的 一 个 后 继 (successor)。 
我 们 通常 会 增加 两 个 分 别称 为 "入口 ”(entry ) 和“ 出口”(exit) 的 结 点 。 它 们 不 和 任何 可 执行 
的 中 间 指 令 对 应 。 从 人口 到 流 图 的 第 一 个 可 执行 结 点 ( 即 包含 了 中 间 代 码 的 第 一 个 指令 的 基本 
块 ) 有 一 条 边 。 从 任何 包含 了 可 能 是 程序 的 最 后 执行 指令 的 基本 块 到 出 口 有 一 条 边 。 如 果 程 序 的 
最 后 指令 不 是 一 个 无 条 件 转移 指令 , 那么 包含 了 程序 的 最 后 一 条 指令 的 基本 块 是 出 口 结 点 的 一 
个 前 驱 。 但 任何 包含 了 跳 转 到 程序 之 外 的 跳 转 指令 的 基本 块 也 是 出 口 结 点 的 前 驱 。 





K Z5 4 成 34] 









































因为 B 包含 了 这 个 程序 的 第 一 个 指令 。B1 的 叭 [ENTRY 
一 后 继 是 By, IN B 的 结尾 不 是 一 个 无 条 件 跳 ee 
HS, HB, 的 首 指令 紧 跟 在 B 的 结尾 指令 ™ Hi 
之 后 。 : ” Fee S a ad Ban 
基本 块 B 有 两 个 后 继 。 其 中 的 一 个 是 它 本 eo es À 
身 , 因为 By 的 首 指令 ( 即 指令 3) 是 B, 结尾 处 的 条 See oN \ 
件 跳 转 指令 ( 即 指令 9) 的 目标 。 另 一 个 后 继 是 By, ta c ty | 
因为 控制 流 可 能 穿越 B 结尾 处 的 条 件 跳 转 指 令 而 ”人 |ateg oo | 
到 达 B, 的 首 指令 。 fey’ 10 goto as | / 
只 有 Bo 指向 流 图 的 出 口 结 点 ,因为 到 达 紧 跟 i 
在 流 图 对 应 的 程序 之 后 的 代码 的 唯一 方式 是 穿越 BB， [i E goro n | 
Bs 结尾 处 的 条 件 跳 转 指令 。 Wi 
8.4.4 流 图 的 表示 方式 a es a 1 
首先 ,从 图 8-9 中 可 以 看 出 ,在 流 图 里 而 把 到 ， |， o 
达 指 令 的 序号 或 标号 的 跳 转 指令 蔡 换 为 到 达 基 本 | N 
块 的 跳 转 ,这么 做 是 很 正常 的 。 回 忆 一 下 , 所 有 条 B | altel = 1o | 
件 或 无 条 件 跷 转 指令 总 是 跳 转 到 某 些 基本 块 的 首 [rte 10 goto ms | / 
指令 ,而 现在 这 些 跳 转 指 令 指向 了 相应 的 基本 块 。 
这 么 做 的 原因 是 , 在 流 图 构造 完成 之 后 经 常会 对 多 [eur] 
个 基本 块 中 的 指令 做 出 实质 性 的 改变 。 如 果 跳 转 Ha ATAU RERRA 


的 目标 是 指令 , 我 们 将 不 得 不 在 每 次 改变 了 某 个 目 
标 指 令 之 后 修正 跳 转 指令 的 目标 。 

流 图 就 是 通常 的 图 , 它 可 以 用 任何 适合 表示 图 的 数据 结构 来 表示 。 结 点 ( 即 基 本 块 ) 的 内 容 
需要 有 它们 自己 的 表示 方式 。 我 们 可 以 用 一 个 指向 该 基本 块 在 三 地 址 指令 数组 中 的 首 指令 的 指 
针 , 再 加 上 基本 块 的 指令 数量 或 一 个 指向 结尾 指令 的 指针 来 表示 结 点 的 内 容 。 但 是 , 因为 我 们 可 
能 会 频繁 改变 一 个 基本 块 中 的 指令 数量 , 所 以 为 每 个 基本 块 创 建 一 个 指令 链表 是 一 种 高 效 的 表 
示 方 法 。 

8.4.5 循环 

像 while 语句 do-while 语句 和 for 语句 这 样 的 程序 设计 语言 构造 自然 地 把 循环 引入 到 程序 
中 。 因 为 事实 上 每 个 程序 会 花 很 多 时 间 执 行 循环 , 所 以 对 于 一 个 编译 器 来 说 , 为 循环 生成 优良 的 
代码 就 变 得 非常 重要 。 很 多 代码 转换 依赖 于 对 流 图 中 “循环 ”的 识别 。 如 果 下 列 条 件 成 立 , 我 们 
就 说 流 图 中 的 一 个 结 点 集合 工 是 一 个 循环 。 

1) 在 工 中 有 一 个 被 称 为 循环 入 口 (loop entry) 的 结 点 , 它 是 唯一 的 其 前 驱 可 能 在 工 之 外 的 结 
点 。 也 就 是 说 , 从 整个 流 图 的 入 口 结 点 开始 到 工 中 的 任何 结 点 的 路 径 都 必然 经 过 循环 入 口 结 点 ， 
并 且 这 个 循环 人 口 结 点 不 是 整个 流 网 的 人口 结 点 本 身 。 


2) 工 中 的 每 个 结 点 都 有 一 个 到 达 工 的 入 口 结 点 的 非 空 路 径 , 并 且 该 路 径 全 部 在 工 中 。 
图 8-9 中 的 流 图 有 三 个 循环 : 
1) Bs 自身 


2) Be 自身 
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3) 18,, By, B4] 

其 中 的 前 两 个 循环 都 由 单一 结 点 组 成 , 这些 结 点 都 有 到 其 自身 的 边 。 比 如 , Bs 形成 一 个 以 
B, 本 身 为 人口 结 点 的 循环 。 请 注意 , 循环 的 第 二 个 条 件 要 求 有 一 个 从 By 到 本 身 的 非 空 路 径 。 因 
此 , 像 Bs 这 样 的 单一 结 点 ( 它 没有 一 条 BB, 的 边 ) 不 是 循环 , 因为 没有 从 B 到 其 自身 , 且 在 
ER |B) 中 的 非 空 路 径 。 

第 三 个 循环 过 = |B, B3, Ba) 的 循环 入 口 结 点 是 B,。 请 注意 , 这 三 个 结 点 中 只 有 B 有 一 个 
不 在 上 中 的 前 驱 B o ME, 这 三 个 结 点 中 都 有 在 上 中 且 到 达 B, 的 非 空 路 径 。 比 如 , 从 By 开始 就 
有 路 径 B, 一 B3 一 Ba 一 By。 口 
8.4.6 8.4 节 的 练习 














练习 8.4. 1: 图 8-10 是 一 个 简单 的 给” 了 ao a en 
阵 乘 法 程序 。 for (j=0; j<n; j++) 
1) 假设 矩阵 的 元 素 是 需要 8 个 字 节 | Geo la ay 
的 数值 , 而 且 征 阵 按 行 存放 。 把 程序 翻译 for (j=0; jen; j++) 
成 为 我 们 在 本 节 中 一 直 使 用 的 那 种 三 地 OF UNG = clad + at oND] 
址 语句 。 : - 
2) 为 (1) 中 得 到 的 代码 构造 流 图 。 图 8-10 “一 个 矩阵 相 乘 算法 


3) 找 出 在 (2) 中 得 到 的 流 图 的 循环 。 

练习 8. 4.2: 图 8-1 中 是 计算 从 2 ~n 之 间 素 数 个 数 的 代码 。 它 在 一 个 适当 大 小 的 数组 a 上 
使 用 得 法 来 完成 计算 。 也 就 是 说 , 最 后 ol 缮 为 真 仅 当 没有 小 于 等 于 , 的 质数 可 以 整除 i。 我 们 一 
开始 把 所 有 的 a[ 让 初始 化 为 TRUE; 如 果 我 们 找到 了 j 的 一 个 因子 , 就 把 a[ 门 设置 为 FALSE, 

1) 把 程序 翻译 成 为 我 们 在 本 节 中 使 用 的 那 种 三 地 址 语句 序列 。 这 里 假设 一 个 整数 需要 4 个 
字 节 存放 。 

2) 为 在 (1) 中 得 到 的 代码 构造 流 图 。 

3) 找 出 在 (2) 中 得 到 的 流 图 的 循环 。 








for (i=2; i<=n; i++) 
a[i] = TRUE; 
count = 0; 
s = sqrt(n); 
for (i=2; i<=s; i++) 
if (ali]) /* 已 知 i 是 一 个 素数 */ { 
count++; 
for (j=2*i; j<=n; j = j+i) 


alj] = FALSE; /* i 的 信 数 都 不 是 素数 */ 











图 8-11 第 法 选取 素数 的 代码 


8.5 基本 块 的 优化 

仅仅 通过 对 各 个 基本 块 本 身 进 行 局 部 优化 , 我 们 就 常常 可 以 实质 性 地 降低 代码 运行 所 需 的 
时 间 。 更 加 彻底 的 全 局 优化 将 从 第 9 章 开始 讨论 。 全 局 优化 将 检查 信息 是 如 何在 一 个 程序 的 多 
个 基本 块 之 间 流 动 的 。 全 局 优化 是 一 个 很 复杂 的 主题 ， 它 将 考虑 很 多 不 同 的 技术 。 
8.5.1 基本 块 的 DAG 表示 

很 多 重要 的 局 部 优化 技术 首先 把 一 个 基本 块 转换 成 为 一 个 DAG( 有 向 无 环 图 ) 。 在 6.11 节 








代码 生成 343 





H, 我 们 介绍 了 用 于 表示 简单 表达 式 的 DAC。 这 个 想法 被 月 然 地 扩展 到 在 一 个 基本 块 中 创建 的 
表达 式 的 集合 。 我 们 按照 如 下 方式 为 一 个 基本 块 构造 DAG: 

1) 基本 块 中 出 现 的 每 个 变量 有 一 个 对 应 的 DAG 的 结 点 表示 其 初始 值 。 

2) 基本 块 中 的 每 个 语句 s 都 有 一 个 相关 的 结 点 No N 的 子 结 点 是 基本 块 中 的 其 他 语句 的 对 
应 结 点 。 这 些 语 名 是 在 s 之 前 、 最 后 一 个 对 s 所 使 用 的 某 个 运算 分 量 进行 定 值 的 语句 。9 

3) 结 点 让 的 标号 是 ;中 的 运算 符 ; 同时 还 有 一 组 变量 被 关联 到 N, 表示 s 是 在 此 基本 块 内 最 
晚 对 这 些 变 量 进行 定 值 的 语句 。 

4) 某 些 结 点 被 指明 为 输出 结 点 (output node) 。 这 些 结 点 的 变量 在 基本 块 的 出 口 处 活跃 。 也 
就 是 说 ,这些 变量 的 值 可 能 以 后 会 在 流 图 的 另 一 个 基本 块 中 被 使 用 到 。 计 算得 到 这 些 “ 活 牙 变 
量 " 是 全 局 数据 流 分 析 的 问题 , 将 在 9.2.5 节 中 讨论 。 

基本 块 的 DAG 表示 使 我 们 可 以 对 基本 块 所 代表 的 代码 进行 一 些 转换 ， 以 改进 代码 的 质量 。 

1) 我 们 可 以 消除 局 部 公共 子 表 达 式 (local common subexpression) 。 所 谓 公共 子 表达 式 就 是 重 
复 计算 一 个 已 经 计算 得 到 的 值 的 指令 。 














2) 我 们 可 以 消除 死 代码 (dead code) ， 即 计算 得 到 的 值 不 会 被 使 用 的 指令 。 
3) 我 们 可 以 对 相互 独立 的 语句 进行 重新 排序 , 这样 的 重新 排序 可 以 降低 一 个 临时 值 需要 保 


持 在 寄存 器 中 的 时 间 。 
4) 我 们 可 以 使 用 代数 规则 来 重新 排列 三 地 址 指令 的 运算 分 量 的 顺序 。 这 么 做 有 时 可 以 简化 
计算 过 程 。 . 
8.5.2 寻找 局 部 公共 子 表达 式 
检测 公共 子 表达 式 的 方法 是 这 样 的 。 当 一 个 新 的 结 点 W 将 被 加 入 到 DAG 中 时 ,我 们 检查 是 
否 存 在 一 个 结 点 N, CAM 具有 同样 的 运算 符 和 子 结 点 , 且 子 结 点 顺序 相同 。 如 果 存 在 这 样 的 结 
点 ，N 计 算 的 值 和 M 计算 的 值 是 一 样 的 ,因此 可 以 用 六 苇 换 W。 在 6.1.1 节 中 , 这 个 技术 被 称 为 
检测 公共 子 表达 式 的 “ 值 编码 ”方法 。 








下 面 的 基本 块 的 DAG 见 图 8-12。 c 
E ba 
c=bte 
d=a-d à do 
当 我 们 为 第 三 个 语句 c = b + c 构造 结 点 的 时 候 , 我 们 

知道 b+ c 中 bp 的 使 用 指向 图 8-12 中 标号 为 -~ 的 结 点 。 因 bo co 


为 这 个 结 点 是 b 的 最 近 的 定 值 。 因 此 , 我 们 不 会 把 语句 1 8-12” 例 8.10 中 的 基本 块 的 DAG 
和 语句 3 所 计算 的 值 混淆 。 
然而 , 对 应 于 第 四 个 语句 Q =a -a 的 结 点 的 运算 符 是 -, 且 它 的 子 结 点 是 标记 有 变量 a 和 


do 的 结 点 。 因 为 运算 符 和 子 结 点 都 和 语句 2 对 应 的 结 点 相同 , 我 们 不 需要 创建 这 个 结 点 , 而 是 
把 G 加 到 这 个 标记 为 - 的 结 点 的 定 值 变量 表 中 。 口 





因为 在 图 8-12 的 DAG 中 只 有 三 个 非 叶 子 结 点 , 看 起 来 例 8. 10 中 的 基本 块 可 以 替换 为 一 个 
只 有 三 个 语句 的 基本 块 。 实 际 上 , 假如 b 在 这 个 基本 块 的 出 口 点 不 活路 , 我 们 不 需要 计算 变量 
b, 可 以 使 用 a 来 存放 图 8-12 中 标号 为 -的 结 点 所 代表 的 值 。 这 个 基本 块 就 变 成 了 : 


O 原文 如 此 。 如 果 * 的 某 个 运算 分 量 在 基本 块 内 没有 在 s 之 前 被 定 值 , 那么 这 个 运算 分 量 对 应 的 子 结 点 就 是 代表 该 
运算 分 量 的 初始 值 的 结 点 。 一 一 译 者 注 








zedte 
但 是 , 如 果 b 和 a 都 在 出 口 处 活路 , 我 们 就 必须 使 用 第 四 个 语句 把 值 从 一 个 变量 复制 到 另 一 个 。 
DE 当 我 们 寻找 公共 子 表达 式 的 时 候 , 我 们 实际 


(+) e 
上 是 寻找 不 管 如 何 计算 一 定 能 得 到 相同 结果 值 的 表达 
式 。 因 此 , DAG 方法 不 能 看 到 下 面 的 事实 , 即 下 面 的 语 G) a ee Yo c 
名 序列 
1 bo co do 
| ? E813 例 8.11 中 的 基本 块 的 DAG 
中 , 第 一 和 第 四 个 语句 实际 上 计算 的 是 同一 个 表达 式 的 值 ， 即 bs + co 。 也 就 是 说 , RA bH c 
在 第 一 个 和 第 四 个 语句 之 间 改 变 了 , 但 它们 的 和 仍 保持 不 变 , 因为 b+c= (5-d) + (c+d)。 这 
个 序列 的 DAG 见 图 8-13。 它 没有 显示 出 任何 公共 子 表达 式 。 但 是 , 如 8.5.4 节 中 将 要 讨论 的 ， 
在 DAG 中 应 用 代数 恒等式 可 以 揭示 出 这 样 的 等 值 关系 。 oO 
8.5.3 消除 死 代码 

在 DAG 上 消除 死 代码 的 操作 可 以 按照 如 下 方式 实现 。 我 们 从 一 个 DAG 上 删除 所 有 没有 附 
加 活路 变量 的 根 结 点 ( 即 没有 父 结 点 的 结 点 ) 。 重 复 应 用 这 样 的 处 理 过 程 就 可 以 从 DAG 中 消除 所 
有 对 应 于 死 代码 的 结 点 。 
网 村 区 如 果 图 8-13 中 的 a 和 上 b 是 活跃 变量 , 而 c Me AB, 我 们 可 以 立刻 消除 标记 为 e 的 
根 结 点 。 然 后 标记 为 c 的 结 点 就 变 成 根 结 点 , 也 可 以 被 删除 。 标 记 为 a Mb 的 结 点 被 保留 下 来 ， 
因为 它们 都 附 有 活跃 变量 。 g 
8.5.4 ”代数 恒等式 的 使 用 

代数 恒等式 表示 基本 块 的 另 一 类 重要 的 优化 方法 。 比 如 , 我 们 可 以 使 用 诸如 


x+0=0+x=x x-O=x 


oar 
nn 
rors 
+ +o 1 + 
a 











xxl=]xx=x x/1=% 
这 样 的 恒等式 来 从 一 个 基本 块 中 消除 计算 步骤。 
另 一 类 代数 优化 是 局 部 强度 消减 (reduction in strength), 就 是 把 一 个 代价 较 高 的 运算 蔡 换 为 
一 个 代价 较 低 的 运算 。 比 如 : 
代价 较 高 的 代价 较 低 的 


x = sxx 
2 xx = +X 
[了 三 x x0.5 


第 三 种 相关 的 优化 是 常量 合并 (constant folding) 。 使 用 这 种 方法 时 , 我 们 在 编译 时 刻 对 常量 
表达 式 求 值 ， 并 把 此 常量 表达 式 蔡 换 为 求 出 的 值 日 。 因 此 ， 表 达 式 2 * 3. 14 可 以 被 替换 为 6. 28. 





O 总 的 来 说 , EA DAG 生成 代码 时 我 们 必须 非常 小 心地 处 理 变量 的 名 字 。 如 果 变 量 * 被 定 值 两 次 , 或 者 虽然 只 赋值 
一 次 但 初始 值 xo 被 使 用 过 , 那么 必须 保证 不 会 在 原先 存放 值 的 结 点 被 全 部 使 用 之 前 改变 x 的 值 。 

O 在 编译 时 刻 对 算术 表达 式 求 值 时 ， 必 须 使 用 和 运行 时 刻 相同 的 求 值 方法 。K，Thompson 给 出 了 一 个 很 完美 的 解决 
方法 : 对 常量 表达 式 进 行 编译 , 在 目标 机 上 执行 目标 代码 ,然后 把 表达 式 蔡 换 为 执行 结果 。 按 照 这 样 的 做 法 , 纺 
至 器 就 不 需要 另 带 一 个 解析 器 o 
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在 实践 中 ,因为 在 程序 中 频繁 使 用 符号 常量 ， 所 以 会 出 现 常 量 表达 式 。 

DAG 的 构造 过 程 可 以 帮助 我 们 使 用 这 些 转换 ,以 及 其 他 的 通用 代数 转换 规则 ,比如 交换 律 
和 结合 律 等 。 比 如 , 假设 语言 的 参考 手册 确定 * 是 可 交换 的 , 也 就 是 说 ,x * y=y*x。 在 创建 一 
个 标记 为 * 且 左 布 子 结 点 分 别 是 下 和 的 新 结 点 时 , 我 们 总 是 检查 这 样 的 结 点 是 否 已 经 存在。 
然而 , 因为 * 是 可 交换 的 , 所 以 我 们 还 应 该 检查 是 否 存在 一 个 标记 为 * 且 左 右 子 结 点 分 别 是 入 和 
M 的 结 点 。 

< 和 = 这 样 的 关系 运算 符 有 时 会 产生 意料 之 外 的 公共 子 表达 式 。 比 如 , RERE x > y 也 
可 以 通过 将 参数 相 减 并 测试 由 减法 运算 设置 的 条 件 代码 来 测试 。 因 此 , 对 * -y 和 x*>y， 只 需要 
生成 一 个 DAG 结 点 9。 

结合 律 也 可 以 用 于 揭示 公共 子 表 达 式 。 比 如 , 如果 源 程序 中 包含 如 下 的 赋值 语句 : 

a=b+ce; 

e=c+d+b; 


则 可 能 生成 下 面 的 中 间 代 码 : 
a=bte 
t=actd 


e = 七 +b 

WR t 没有 在 基本 块 之 外 使 用 , 通过 应 用 + 的 交换 律 和 结合 律 ,我 们 可 以 把 这 个 序列 改 为 : 
a=bte 

e=atd 


编译 器 的 设计 者 应 该 仔细 阅读 语言 的 参考 手册 ,以 决定 可 以 重新 排列 哪些 计算 。 因 为 计算 
机 算术 (因为 上 涪 或 下 溢 等 原因 ) 可 能 不 一 定 遵守 数学 上 的 代数 恒等式 。 比 如 ，Fortran 语言 标准 
说 , 编译 器 可 以 通过 任意 数学 上 等 价 的 表达 式 来 求 值 , 前 提 是 不 能 违反 原来 表达 式 的 括号 的 一 致 
HES, AL, 编译 器 可 以 用 x * (y -z) 的 方式 来 计算 x*y - x*z, 但 是 它 不 能 以 (a +5) -c 的 方 
式 计算 a+ (b-c) 。 因 此 , 如 果 一 个 Fortran 编译 器 想 按 照 语言 的 定义 来 优化 程序 , 它 必须 跟踪 源 
语言 表达 式 中 哪些 地 方 有 括号 。 
8.5.5 数组 引用 的 表示 

初 看 上 去 ,数组 下 标 指令 似乎 可 以 像 其 他 的 运算 那样 处 理 。 比 如 , 考虑 下 列 的 三 地 址 指令 


序列 : 
x = ali] 
alj] = y 
z = a[i] 


如 果 我 们 把 a[ i] 当 作 是 一 个 和 a +i 类 似 的 关于 a 和 i 的 普通 运算 , 那么 ali ] 的 两 次 使 用 
看 起 来 好 像 是 一 个 公共 子 表达 式 。 在 这 种 情况 下 , 我 们 可 能 会 把 第 三 个 指令 z = a[ ij 优化 为 
z =xe。 然而 ,因为 了 可 能 等 于 i, 中 间 的 语句 可 能 实际 上 改变 了 al ij] 的 值 。 因 此 , 这 种 优化 是 
不 合法 的 。 

在 DAG F, 表示 数组 访问 的 正确 方法 如 下 。 : 

1) 从 一 个 数组 取 值 并 赋 给 其 他 变量 的 运算 (比如 x =a[i]) 用 一 个 新 创建 的 运算 符 为 =[] 
的 结 点 表示 。 这 个 结 点 的 左右 子 结 点 分 别 代表 数组 初始 值 (本 例 中 是 ao ) 和 下 标 i, WEEE x 是 这 
个 结 点 的 标号 之 一 。 

2) 对 数组 的 赋值 (比如 ali] = Y) 用 一 个 新 创建 的 运算 符 为 [ ] = 的 结 点 来 表示 。 这 个 结 点 
的 三 个 子 结 点 分 别 表 示 a。、j 和 Y。 没 有 变量 用 这 个 结 点 标号 。 不 同 之 处 在 于 此 结 点 的 创建 杀 





© 然而 , 减法 运算 可 能 引起 上 滋 或 下 溢 ， 而 比较 指令 不 会 引起 这 个 问题 。 
O 即 不 能 跨越 括号 求 值 一 一 译 者 注 。 








死 了 所 有 当前 已 经 建立 的 , 其 值 依赖 于 ae 的 结 点 。 一 个 被 杀 死 的 结 点 不 可 能 再 获得 任何 标号 。 
也 就 是 说 , 它 不 可 能 成 为 一 个 公共 子 表达 式 。 


x = alil 
afjJ = y 
z = ali] (j= 


的 DAG 见 图 8-14。 对 应 于 x 的 结 点 N 首先 被 创建 , 但 是 
当 标号 为 [ ] = 的 结 点 被 创建 时 ，N 就 被 杀 死 了 。 因 此 当 = 
的 结 点 被 建立 时 , 它 不 会 被 认为 和 N 等 同 , 而 是 必须 创建 
一 个 具有 同样 的 运算 分 量 ae 和 io 的 新 结 点 。 g “图 8-14 一 个 数组 赋值 序列 的 DAG 
DEE 有 时 即使 某 个 结 点 的 所 有 子 结 点 都 没有 像 例 8. 13 中 的 ao 那样 的 附加 数组 变量 , 它 
也 必须 被 杀 死 。 类 似 地 ,如 果 一 个 结 点 具有 数组 后 代 , 即使 它 的 子 结 点 都 不 是 数组 结 点 ， 它 也 可 
以 杀 死 别 的 结 点 。 例 如 考虑 下 面 的 三 地 址 代码 

















b= 12+a 
x = bli] 全 
> OROTAN : {BIB 
这 里 的 情况 是 ,为 了 效率 方面 的 原因 , SIE aD 
组 a 中 的 一 个 位 置 。 例 如 , 如 果 a 的 元 素 长 度 是 4 
个 字 节 , 那么 b 代表 了 a 的 第 四 个 元 素 。 如 果 j 和 
i 表示 同一 个 值 , 那么 b[ 4] 和 b[j] 代 表 了 同一 个 
位 置 。 因 此 ,很 重 要 的 一 件 事 情 就 是 让 第 三 个 指令 2 w woo k > 
pli] =y 杀 死 带 有 附加 变量 x 的 结 点 。 然 而 , 正如 oes Menke than pence 
我 们 在 图 8-15 中 看 到 的 ,被 杀 的 结 点 和 杀 死 被 杀 结 eee eee ee ncaa 


点 的 结 点 都 把 ao 作为 孙 结 点 , 而 不 是 子 结 点 。 O 
8.5.6 指针 赋值 和 过 程 调用 

当 我 们 像 下 面 的 赋值 语句 

ty 
那样 , 通过 指针 进行 间接 赋值 时 , 我 们 并 不 知道 p 和 a 指向 哪里 。 从 效果 看 , x= "pv 是 对 任意 变 
量 的 使 用 , 而 “Ga =y 可 能 对 任意 一 个 变量 赋值 。 其 结果 是 , 运算 符 =* 必须 把 当前 所 有 带 有 附加 
标识 符 的 结 点 当 作 其 参数 。 但 是 这 么 做 会 影响 死 代 码 的 消除 过 程 。 更 加 重要 的 是 ，*= 运 算 符 会 
把 至 今 为 止 构 造 出 来 的 DAG 中 的 其 他 结 点 全 部 杀 死 。 

我 们 可 以 进行 一 些 全 局 指针 分 析 ， 以 便 把 一 个 指针 在 代码 中 某 个 位 置 上 可 能 指向 的 变量 限 
制 在 一 个 较 小 的 子 集 内 。 即 使 是 局 部 分 析 也 可 以 限制 一 个 指针 指向 的 范围 。 比 如 , 对 于 下 面 的 
序列 


p = &x 

PE y: : 
我 们 知道 是 x( 而 不 是 其 他 变量 ) 被 赋予 y 的 值 。 因 此 , 我 们 只 需要 杀 死 以 x 为 附加 变量 的 结 点 ， 
不 需要 杀 死 其 他 结 点 。 | 

过 程 调用 和 通过 指针 赋值 很 相似 。 在 缺乏 爹 局 数据 流 信息 的 情况 下 ,我 们 必须 假设 一 个 过 ， 
程 调用 使 用 和 改变 了 它 访问 的 所 有 数据 。 因 此 , 如 果 变 量 x 在 一 个 过 程 的 访问 范围 之 内 , 对 P 
的 调用 不 仅 使 用 了 以 x 为 附加 变量 的 结 点 ， 还 杀 死 了 这 个 结 点 。 
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8.5.7 ”从 DAG 到 基本 块 的 重组 

对 DAG 的 各 种 优化 处 理 可 以 在 生成 DAG 图 时 进行 , 也 可 以 在 DAG 构造 完成 后 通过 对 DAG 
的 运算 完成 。 在 完成 这 些 优 化 处 理 之 后 , 我 们 就 可 以 根据 优化 得 到 的 DAG 重组 生成 相应 基本 块 
的 三 地 址 代码 。 对 每 个 具有 一 个 或 多 个 附加 变量 的 结 点 , 我 们 构造 一 个 三 地 址 语 甸 来 计算 其 中 
某 个 变量 的 值 。 我 们 倾向 于 把 计算 得 到 的 结果 赋 给 一 个 在 基本 块 出 口 处 活路 的 变量 。 但 是 ， 如 
果 我 们 没有 全 局 活路 变量 的 信息 作为 依据 ,就 要 假设 程序 的 所 有 变量 都 在 基本 块 出 口 处 活路 (但 
是 不 包含 编译 器 为 了 处 理 表达 式 而 生成 的 临时 变量 ) 。 

如 果 结 点 有 多 个 附加 的 活跃 变量 , 我 们 就 必须 引入 复制 语句 ， 以 便 给 每 一 个 变量 都 赋予 正确 
的 值 。 有 时 我 们 可 以 通过 全 局 优化 技术 , 设法 用 其 中 的 一 两 个 变量 来 蔡 代 其 他 变量 ,从 而 消除 这 
些 复制 语句 。 i 
HRE 回顾 一 下 图 8-12 中 的 DAG。 在 例 8. 10 后 面 的 讨论 中 , 我 们 确定 如 果 b 在 基本 块 的 出 


口 处 不 活跃 , 那么 下 面 的 三 个 语句 
a=bte 
d=a-d 
c=dte 


就 足以 重建 那个 基本 块 了 。 第 三 个 指令 c =Q + c 必须 使 用 G 而 不 是 b 作为 运算 分 量 , 因为 经 过 
优化 的 基本 块 不 会 计算 b 的 值 。 

WR b 和 a 都 在 出 日 处 活跃 , 或 者 我 们 不 能 够 确定 它们 是 否 在 出 口 处 活跃 , 那么 我 们 还 是 需 
要 计算 a Alb 的 值 。 我 们 可 以 用 下 面 的 序列 来 完成 这 个 计算 : 








c=dte 

这 个 基本 块 仍然 比 原来 的 基本 块 高 效 。 虽 然 指令 数目 相同 , 但 我 们 已 经 把 一 个 减法 蔡 换 为 
一 个 复制 运算 。 在 大 多 数 机 器 上 , 复制 运算 要 比 减法 更 加 高 效 。 不 仅 如 此 , 我 们 还 有 可 能 通过 全 
局 分 析 把 此 基本 块 外 对 b 的 使 用 全 部 替换 为 对 a 的 使 用 ,从 而 消除 在 基本 块 外 对 b 的 使 用 。 在 
这 种 情况 下 , 我 们 就 可 以 再 次 回 到 这 个 基本 块 并 消除 b = Ga。 直 观 地 讲 ， 如 果 在 任何 使 用 jp 的 这 
个 值 的 时 刻 , a 中 的 值 仍然 和 bb 一样, 那么 我 们 就 可 以 消除 这 个 复制 运算 。 这 种 情况 是 否 成 立 依 
束 于 程序 如 何 重新 计算 a 的 值 。 口 

当 从 DAG 重 构 基 本 块 时 , 我 们 不 仅 要 关心 用 哪些 变量 来 存放 DAG 中 的 结 点 的 值 , 还 要 关心 
计算 不 同 结 点 值 的 指令 的 顺序 。 应 记 住 如 下 规则 : 

1) 指令 的 顺序 必须 遵守 DAG 中 的 结 点 的 顺序 。 也 就 是 说 ,只 有 在 计算 出 一 个 结 点 的 各 个 子 
结 点 的 值 之 后 , 才 可 以 计算 这 个 结 点 的 值 。 

2) 对 数组 的 赋值 必须 跟 在 所 有 (按照 原 基本 块 中 的 指令 顺序 ) 在 它 之 前 的 对 同一 数组 的 赋值 
或 求 值 运算 之 后 。 

3) 对 数组 元 素 的 求 值 必须 跟 在 所 有 (在 原 基 本 块 中 ) 在 它 之 前 的 对 同一 数组 的 赋值 指令 之 
后 。 对 同一 数组 的 两 个 求 值 运算 可 以 交换 顺序 ,只 要 在 交换 时 它们 都 没有 越过 某 个 对 同一 数组 
的 赋值 运算 即 可 。 8 

4) 一 个 变量 的 使 用 必须 跟 在 所 有 (在 原 基 本 块 中 ) 在 它 之 前 的 过 程 调用 和 指针 间接 赋值 运算 之 后 。 

5) 任何 过 程 调用 或 者 指针 间接 赋值 都 必须 跟 在 所 有 (在 原 基 本 块 中 ) 在 它 之 前 的 对 任何 变量 
的 求 值 运算 之 后 。 

也 就 是 说 , 当 重 组 代码 的 时 候 , 没有 一 个 语句 可 以 跨越 过 程 调用 或 指针 间接 赋值 运算 。 只 有 
在 两 个 使 用 同一 个 数组 的 指令 都 是 数组 访问 而 不 是 对 数组 元 素 赋值 时 , 它们 才 可 以 交换 顺序 。 
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8.5.8 8.5 节 的 练习 
练习 8. 5.1: 为 下 面 的 基本 块 构 造 DAG。 


a=bee 
e=at+b 
bebxe 


a=e-@ 

练习 8. 5. 2: 分 别 按照 下 列 两 种 假设 简化 练习 8. 5.1 的 三 地 址 代码 。 

1) RA a TEREZA IRAY Hi FARIS IER o 

2) a, b, c 在 基本 块 的 出 口 处 活 牙 。 

练习 8.5.3; 为 图 8-9 中 的 块 B6 的 代码 构造 DAG。 请 不 要 忘记 包含 比较 指令 i<10。 
练习 8. 5.4: 为 图 8.9 中 的 块 By 的 代码 构造 DAG。 

练习 8. 5.5: 扩展 算法 8.7, 使 之 可 以 处 理 如 下 的 三 地 址 语句 (原文 为 three-statements 
1)a[li] = b 

2)a = bli] 

3) a = *b 

4) *a = 

练习 8. 5. 6: 分 别 按照 下 面 的 两 个 假设 , 为 基本 块 

ali] = b 

*p=c 

d = alj] 

e = *p 

*p = ali] 


构造 DAG 图 。 假设 如 下 : 

1) p 可 以 指向 任何 地 方 。 

2) p 只 能 指向 b 或 a。 

| 练习 8. 5.7: 如 果 一 个 指针 或 数组 表达 式 ( 比如 ali ] 或 者 * p) 被 赋值 之 后 又 被 使 用 , A 
值 和 使 用 之 间 没 有 做 任何 修改 , 我 们 就 可 以 利用 这 种 情况 来 简化 DAG。 比 如 , 在 练习 8.5.6 的 代 
BE, AX p 可 能 指向 的 所 有 位 置 在 第 二 个 和 第 四 个 语句 之 间 没 有 被 赋值 ， 所 以 不 管 p 指向 哇 
里 , 语句 e =*p 都 可 以 被 蔡 换 为 e = c。 请 修正 DAC 构造 算法 以 利用 这 种 情况 带 来 的 好 处 , 并 
把 你 的 算法 应 用 到 练习 8. 5.6 的 代码 中 。 

练习 8. 5. 8: 假设 一 个 基本 块 由 下 面 的 C 语言 赋值 语句 生成 : 


x=atbtctdtert fi 
yratcte; 


1) 给 出 这 个 基本 块 的 三 地 址 语句 (每 个 语句 只 做 一 次 加 法 ) 。 
2) 假设 x M y 都 在 基本 抉 的 出 口 处 活跃, 利用 加 法 的 结合 律 和 交换 律 来 修改 这 个 基本 类 
使 得 指令 个 数 最 少 。 


8.6 一 个 简单 的 代码 生成 器 


在 本 节 中 , 我 们 将 考虑 一 个 为 单个 基本 块 生成 代码 的 算法 。 它 依次 考虑 各 个 三 地 址 指令 ,并 
跟踪 记录 哪个 值 存放 在 哪个 寄存 器 中 。 这 样 可 以 避免 生成 不 必要 的 加 载 和 保存 指令 。 
在 代码 生成 中 的 主要 问题 之 一 是 决定 如 何 最 大 限度 地 利用 寄存 器 。 寄 存 器 有 如 下 四 种 主要 … 
使 用 方法 : 
e 在 大 部 分 机 器 的 体系 结构 中 , 执行 一 个 运算 时 该 运算 的 部 分 或 全 部 运算 分 量 必 须 存放 在 
寄存 器 中 。 
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。 寄存 器 很 适合 做 临时 变量 , 即 在 计算 一 个 大 表达 式 时 存放 其 子 表达 式 的 值 。 或 者 更 一 般 
地 讲 , 寄存 器 适合 用 于 存放 只 在 单个 基本 坎 内 使 用 的 变量 的 值 。 

o 寄存 器 用 来 存放 在 一 个 基本 块 中 计算 而 在 另 一 个 基本 块 中 使 用 的 (全 局 ) 值 。 比 如 , 循环 
下 标的 值 , 每 次 循环 都 对 该 值 作 增 量 运算 ,并 在 循环 体 中 多 次 被 使 用 。 

o 寄存 器 经 常用 来 帮助 进行 运行 时 刻 的 存储 管理 。 比 如 , 管理 运行 时 刻 栈 包 括 栈 指针 的 维 
护 , 栈 顶 元 素 也 可 能 被 存放 在 寄存 器 中 。 

因为 可 用 寄存 器 的 数量 是 有 限 的 , 这 些 需求 之 间 有 相互 竞争 的 关系 。 

本 节 的 算法 假设 有 一 组 寄存 器 可 以 用 来 存放 在 基本 块 内 使 用 的 值 。 通 常情 况 下 , 这 个 寄存 
器 集合 不 包括 机 器 的 所 有 寄存 器 ,因为 有 些 寄 存 器 专门 用 于 存放 全 局 变量 或 者 用 于 对 栈 进行 管 
理 。 我 们 假设 基本 块 已 经 通过 诸如 公共 子 表达 式 合并 这 样 的 转换 而 变 成 了 我 们 希望 的 三 地 址 指 
令 序列 。 我 们 进一步 假设 对 每 个 运算 符 有 且 只 有 一 个 对 应 的 机 器 指令 。 这 个 指令 对 存放 在 寄存 
器 中 的 所 需 的 运算 分 量 进行 运算 ,并 把 结果 存放 在 一 个 寄存 器 中 。 机 器 指令 的 形式 如 下 : 

© LD reg, mem 

@ ST mem, reg 

® OP reg, reg, reg. 

8. 6. 1 寄存 器 和 地 址 描述 符 

我 们 的 代码 生成 算法 依次 考虑 了 各 个 三 地 址 指令 , 并 决定 需要 哪些 加 载 指令 来 把 必需 的 运 
算 分 量 加 载 进 寄存 器 。 在 生成 加 载 指令 之 后 , 它 开始 生成 运算 代码 。 然 后 , 如 果 有 必要 把 结果 存 
放 入 一 个 内 存 位 置 , 它 还 会 生成 相应 的 保存 指令 。 

为 了 做 出 这 些 必要 的 决定 , 我 们 需要 一 个 数据 结构 来 说 明 哪 些 程序 变量 的 值 当 前 被 存放 在 
哪个 或 哪些 寄存 器 里 面 。 我 们 还 需要 知道 当前 存放 在 一 个 给 定 变量 的 内 存 位 置 上 的 值 是 否 就 是 
这 个 变量 的 正确 值 。 因 为 变量 的 新 值 可 能 已 经 在 寄存 器 中 计算 出 来 但 还 没有 存放 到 内 存 中 。 这 
个 数据 结构 具有 下 列 描述 符 : 

1) 每 个 可 用 的 寄存 器 都 有 一 个 寄存 器 描述 符 (register descriptor) 。 它 用 来 跟踪 有 了 哪些 变量 的 
当前 值 存放 在 此 寄存 器 内 。 因 为 我 们 仅仅 考虑 那些 用 于 存放 一 个 基本 块 内 的 局 部 值 的 寄存 器 ， 
我 们 可 以 假设 在 开始 时 所 有 的 寄存 器 描述 符 都 是 空 的 。 随 着 代码 生成 过 程 的 进行 ,每 个 寄存 器 
将 存放 零 个 或 多 个 变量 名 字 的 值 。 

2) 每 一 个 程序 变量 都 有 一 个 地 址 描述 符 (address descriptor) 。 它 用 来 跟踪 记录 在 哪个 或 哪些 位 
置 上 可 以 找到 该 变量 的 当前 值 。 这 个 位 置 可 以 是 一 个 寄存 器 、 一 个 内 存 地 址 、 一 个 栈 中 的 位 置 , 也 
可 以 是 由 这 些 位 置 组 成 的 一 个 集合 。 这 个 信息 可 以 存放 在 这 个 变量 名 字 对 应 的 符号 表 条 目 中 。 
8.6.2 代码 生成 算法 

这 个 算法 的 一 个 重要 部 分 是 函数 getReg(7) 。 这 个 函数 为 每 个 与 三 地 址 指令 了 7 有关 的 内 存 位 
置 选择 寄存 器 。 函 数 getReg 可 以 访问 这 个 基本 块 的 所 有 变量 对 应 的 寄存 器 和 地 址 描述 符 。 这 个 
消 数 还 可 能 需要 获取 一 些 有 用 的 数据 流 信 息 ， 比 如 哪些 变量 在 基本 块 出 口 处 活跃 。 我 们 将 首先 
给 出 基本 算法 , 然后 再 讨论 getReg 函数 。 我 们 不 知道 总 共有 多 少 个 寄存 器 可 用 于 存放 基本 块 的 
局 部 数据 , 因此 假设 有 足够 的 寄存 器 使 得 在 把 值 存放 问 内 存 ， 释 放 了 所 有 的 可 用 寄存 器 之 后 ,， 2S 
朵 的 寄存 器 足以 完成 任何 三 地 址 运算 。 


机 器 指令 。 因 此 , 我 们 没有 利用 + 的 交换 性 。 这 样 ， 当 我 们 实现 这 个 运算 时 , y 的 值 必须 在 ADD 
省 令 中 给 出 的 第 二 个 寄存 器 中 , 而 绝 不 会 是 第 三 个 寄存 器 。 可 以 按照 下 面 的 方法 来 改进 算法 : 只 
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要 + 是 一 个 满足 交换 律 的 运算 符 , 等 法 同时 为 x=y+z 和 x=z+y 生 成 代码 ; 随后 再 选择 一 个 
比较 好 的 代码 序列 。 

运算 的 机 器 指令 

对 每 个 形 如 x=y+z 的 三 地 址 指令 , 完成 下 列 步 又 : 

1) 使 用 getReg(x =y+z) 来 为 x、y、z 选择 寄存 器 。 我 们 把 这 些 寄存 器 称 为 Re, R, 和 R,。 

2) 如 果 ( 根据 R, 的 寄存 器 描述 符 )y 不 在 RR 中, 那么 生成 一 个 指令 “LD R,, y”, 其 中 y' 是 
存放 y 的 内 存 位 置 之 --(y' 可 以 根据 y 的 地 址 描述 符 得 到 ) 。 

3) 类 似 地 , 如 果 z 不 在 R, A, 生成 一 个 指令 “LD R, z”, 其 中 z' 是 存放 z 的 位 置 之 一 。 

4) 生成 指令 “ADD R,, Ry, R” o 

复制 语句 的 机 器 指令 

JEUN x = y 的 三 地 址 指令 是 一 个 重要 的 特例 。 我 们 假设 getReg 总 是 为 x M y 选择 同一 个 寄存 
fit WMR y 没有 在 寄存 器 R, P, 那么 生成 机 器 指令 LD R yo WR y BAER, 中 ,我们 不 需要 
做 任何 事情 。 我 们 只 党 要 修改 R, 的 寄存 器 描述 符 ， 表明 R, 中 也 存放 了 x 的 值 。 

基本 块 的 收尾 处 理 

我 们 描述 算法 时 表明 , 在 代码 结束 的 时 候 , 基本 块 中 使 用 的 变量 可 能 仅 存放 在 某 个 寄存 器 
中 。 如 果 这 个 变量 是 一 个 只 在 基本 块 内 部 使 用 的 临时 变量 , 那 就 没有 问题 ; 当 基 本 块 结束 时 , 我 
们 可 以 忘记 这 些 临 时 变量 的 值 并 假设 这 些 寄 存 器 是 空 的 。 但 如 果 一 个 变量 在 基本 块 的 出 口 处 活 
K, 或 者 我 们 不 知道 哪些 变量 在 出 口 处 活跃 , 那么 就 必须 假设 这 个 变量 的 值 会 在 以 后 被 用 到 。 在 
那 种 情况 下 , 对 于 每 个 变量 x*, 如 果 它 的 地 址 描述 符 表 明 它 的 值 没 有 存放 在 * 的 内 存 位 置 上 , 我 
们 必须 生成 指令 ST x, R, 其 中 R 是 在 基本 块 的 结尾 处 存放 x 值 的 寄存 器 。 

管理 寡 存 器 和 地 址 描述 符 

当代 码 生成 算法 生成 加 载 、 保 存 和 其 他 机 器 指令 时 , 它 必 须 同 时 更 新 寄存 器 和 地 址 描述 符 。 
修改 的 规则 如 下 : 

1) 对 于 指令 “LD R, x”: 

D 修改 寄存 器 只 的 寄存 器 描述 符 , 使 之 只 包含 x。 

修改 x 的 地 址 描述 符 , 把 寄存 器 R 作为 新 增 位 置 加 入 到 x 的 位 置 集合 中 。 

@ 从 任何 不 同 于 x 的 变量 的 地 址 描述 符 中 删除 证 。( 原文 缺 一 条 一 一 译 者 注 。) 

2) 对 于 指令 ST x, R, 修改 4 的 地 址 措 述 符 , 使 之 包含 自己 的 内 存 位 置 。 

3) 对 于 实现 三 地 址 指令 x sy +z 的 “ADD R, Ry, R,” 这 样 的 运算 而 言 : 

D BER, 的 寄存 器 描述 符 , 使 之 只 包含 xo 

© 改变 * 的 地 址 描述 符 使 得 它 只 包含 位 置 R,。 注 意 , 现在 % 的 地 址 描述 符 中 不 包含 * 的 内 
存 位 置 。 

O 从 任何 不 同 于 x 的 变量 的 地 址 描述 符 中 删除 R,。 : 

4) 当 我 们 处 理 复制 语句 =y 时 , 如 果 有 必要 生成 把 y 加 载 入 ,的 加 载 指 令 , 那么 在 生成 加 ， 
载 指 令 并 (按照 规则 1 ) 像 处 理 所 有 的 加 载 指令 那样 处 理 完备 个 描述 符 之 后 ， 再 进行 下 面 的 处 理 :， i 

@ 把 x 加 入 到 RR, 的 寄存 器 描述 符 中 。 4 

@ 修改 x 的 地 址 描述 符 , 使 得 它 只 包含 唯一 的 位 置 R,。 
让 我 们 把 由 下 列 三 地 址 语句 组 成 的 基本 块 翻译 成 代码 。 


=a -bb 








t 
usa-c 
vrttu 
a 
a 
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O 这 里 ,我 们 假设 t、u、v 都 是 基本 块 的 局 部 临时 变量 , TZEN a, b, c, d 在 基本 块 出 口 处 活 牙 。 
。 因为 我 们 还 没有 讨论 函数 getReg 是 如 何 工作 的 , 所 以 将 简单 地 假设 当 需 要 时 总 有 足够 的 寄存 器 

可 用 。 但 是 当 一 个 寄存 器 中 存放 的 值 不 再 有 用 时 (比如, 它 只 存放 了 一 个 临时 变量 的 值 ， 且 对 这 
个 临时 变量 的 所 有 使 用 都 已 经 处 理 完了 )， 我 们 就 复 用 这 个 寄存 器 。 







































































图 8-16 显示 了 算法 生成 的 所 有 机 器 代码 指令 。 该 图 还 显示 了 在 翻译 每 个 三 地 址 指令 之 前 和 
之 后 的 寄存 器 和 地 址 描述 符 的 情况 。 
Ri R2 R3 a b c d T u v 
A EE lve [Ser al Ts le 
LD Ri, a 
LD R2, b 
SUB R2, R1, R2 
a |t aRt b [c Ja jr] 1 |) 
u=a-c i 
LD R3, c 
SUB R1, R1, R3 
Tul lt fe alb eR] a [R2 [Rif] | 
V=t+nu 
ADD R3, R2, R1 
u ft lv a |b | ¢ | 4 | R2 | Ri | R3 | 
aed 
LD R2, d 
u fad] v | [R2] b | c jana] | Ri [R3 
Sr RS re dee eee tex eS 
ADD Ri, R3, R1 
: pan a ae R2 |b [| c [Ri] _ La3 
exit WO 
ST a, R2 
ST d, R1 
[a [alv | fre] > |c jarif | [Tan 


























图 8-16 生成 的 指令 以 及 寄存 器 和 地 址 描述 符 的 改变 过 程 


因为 最 初 寄存 器 中 不 保存 任何 值 , 我 们 需要 为 第 一 个 三 地 址 指令 t =a -Pb 生成 三 个 指令 。 
”因此 , 我 们 看 到 a 和 b 被 加 载 到 寄存 器 RL 和 R2 中 , 而 的 值 生成 后 存放 于 寄存 器 R2 中 。 注 
意 , 我 们 可 以 使 用 R 来 存放 上 是 因为 原先 存放 于 R 中 的 b 的 值 在 该 基本 块 内 不 再 被 使 用 。 因 
为 预 设 了 b 在 基本 抉 的 出 口 处 活跃 , 假如 (b 的 地 址 描述 符 表明 )b 不 在 它 自 己 的 内 存 位 置 上 , 那 
么 我 们 将 不 得 不 先 把 R 中 的 值 保存 到 b。 假 如 我 们 需要 R2, 那么 生成 指令 ST b R2 的 决定 将 由 
getReg 做 出 。 

第 二 个 指令 u =a -c 不 需要 加 载 a 的 指令 , 因为 a 已 经 存放 在 寄存 器 RL 中 。 原 来 存放 在 
寄存 器 RI 中 的 a 的 值 在 该 基本 抉 中 不 再 被 用 到 , 而 且 如 果 在 基本 块 之 外 需要 使 用 a 的 值 , 可 以 
从 a 的 内 存 位 置 上 获取 (因为 a 的 值 也 在 它 自己 的 内 存 位 置 上 )。 因 此 , 我 们 还 可 以 复 用 R1 来 存 
放 结 果 u。 请 注意 , 我 们 改变 了 a 的 地 址 描述 符 , 以 表明 它 已 经 不 在 R1 中 , 但 是 还 在 称 为 a 的 
内 存 位 置 中 。 

第 三 个 指令 v =t +u 只 需要 一 个 加 法 指令 。 而 且 , 我 们 可 以 用 R 来 存放 结果 v， 因 为 原先 
存放 在 该 寄存 器 中 的 c 的 值 在 该 基本 块 内 不 再 使 用 , 且 c 在 自己 的 内 存 位 置 上 也 存放 了 这 个 值 。 

复制 指令 a =G 需要 一 个 指令 来 加 载 a, 因为 a 不 在 寄存 器 中 。 图 中 显示 寄存 器 R2 的 描述 
符 包 含 了 a 和 bb。 把 a 加 入 到 寄存 器 描述 符 是 我 们 处 理 这 个 复制 语句 的 结果 , 而 不 是 任何 机 器 指 
令 的 结果 。 
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第 五 个 指令 a =v +u 使 用 两 个 存放 在 寄存 器 中 的 值 。 因 为 u 是 一 个 临时 变量 且 它 的 值 不 再 
被 使 用 , 所 以 我 们 选择 复 用 它 的 寄存 器 R1 来 存放 a 的 新 值 。 请 注意 , a 现在 只 存放 在 RIP, 不 
在 它 自己 的 内 存 位 置 上 。 对 于 a 也 是 同样 的 情况 , a 的 值 只 存放 在 R 中 ， | 
存 位 置 上 。 因 为 这 个 原因 , 我 们 需要 为 基本 块 的 机 器 代码 增加 一 个 “尾声 ”: 它 把 在 出 口 处 活 牙 
的 变量 a 和 a 的 值 保存 回 它 们 的 内 存 位 置 。 这 就 是 图 中 的 最 后 两 个 指令 的 工作 。 口 
8.6.3 ”函数 getReg 的 设计 

最 后 , 让 我 们 考虑 如 何 针对 一 个 三 地 址 指令 1 实现 函数 getReg (1) 。 实 现 这 个 函数 可 以 选择 
很 多 种 方法 ,当然 也 存在 一 些 绝对 不 可 以 选择 的 方法 。 这 些 错 误 方法 会 因 丢 失 一 个 或 多 个 活跃 
变量 的 值 而 导致 生成 错误 代码 。 我 们 用 处 理 一 个 运算 指令 的 步 又 来 开始 我 们 的 讨论 , 还 是 用 x = 
y+z 作 为 一 般 性 的 例子 。 首 先 , 我 们 必须 为 y 和 z 分 别 选 择 一 个 寄存 器 。 这 两 次 选择 所 面临 的 问 
题 是 相同 的 , 因此 我 们 将 集中 考虑 为 y 选择 寄存 器 R, 的 方法 。 选 择 规则 如 下 : 

1) 如 果 y 当前 就 在 一 个 寄存 器 中 , 则 选择 一 个 已 经 SALA Ty 的 寄存 器 作为 R,。 不 需要 生成 

一 个 机 器 指令 来 把 y 加 载 到 这 个 寄存 器 。 

2) 如 果 y 不 在 寄存 器 中 , 但 是 当前 存在 一 个 空 寄 存 器 , 那么 选择 这 个 空 寄存 器 作为 Ro 

3) 比较 困难 的 情况 是 7 不 在 寄存 器 中 且 当 前 也 没有 空 我 们 需要 选择 一 
个 可 行 的 寄存 器 ,并 且 必 须 保证 复 用 这 个 寄存 器 是 安全 的 。 设 尺 是 一 个 候选 寄存 器 , 且 假 设 v 是 
R 的 寄存 器 描述 符 表明 的 已 位 于 RR 中 的 变量 。 我 们 需要 保证 要 么 42 的 值 已 经 不 会 被 再 次 使 用 ,要 
么 我 们 还 可 以 到 别 的 地 方 获取 "的 值 。 可 能 的 情况 包括 : 

人 MR ov lage areca rea eter ae pe 

@ mo fix, 即 由 指令 1 计算 的 变量 , 有 旦 x 不 同时 是 指令 7 的 运算 分 量 之 一 (比如 这 个 例子 
De S A 
用 , 因此 我 们 可 以 忽略 它 。 

@ 否则 ,如果 "不 会 在 此 之 后 被 使 用 ( 即 在 指令 | 之 后 不 会 再 次 使 用 ", BMR o 在 基本 块 的 
出 口 处 活跃 , 那么 > 的 值 必然 在 基本 块 中 被 重新 计算 ), 那么 我 们 就 完成 了 任务 。 

O 如 果 前 面 的 三 个 条 件 都 不 满足 , 我 们 就 需要 生成 保存 指令 ST v, R 来 把 v 的 值 复制 到 它 自 
已 的 内 存 位 置 上 去 。 这 个 操作 称 为 溢出 操作 (sp 这 ) 。 

因为 在 那个 时 刻 丸 可 能 存放 了 多 个 变量 的 值 , 所 以 我 们 需要 对 每 个 这 样 的 变量 " 重复 上 述 步 
R. BA, R 的 “得 分 "是 我 们 需要 生成 的 保存 指令 的 个 数 。 选 择 一 个 具有 最 低 得 分 的 寄存 器 (或 
之 一 )。 

现在 考虑 寄存 器 RR, 的 选择 。 其 中 的 难点 和 可 选项 几乎 和 选择 R, 时 的 一 样 ,因此 我 们 只 给 
出 其 中 的 区 别 。 

1) 因为 x 的 一 个 新 值 正在 被 计算 , 因此 只 存放 了 >x 的 值 的 寄存 器 对 R, 来 说 总 是 可 接受 
使 + 就 是 y 或 z 之 一 , 这 个 语句 仍然 成 立 ， 因 为 我 们 的 机 器 指令 允许 一 个 指令 中 的 两 个 寄存 器 
相同 。 

2) 如 果 ( 像 上 面 对 变 量 v 的 描述 那样 )y 在 指令 7 之 后 不 再 使 用 , 且 ( 在 必要 时 加 载 y 之 后 ) 
Ry 仅仅 保存 了 7 的 值 , ABA R, 同时 也 可 以 用 作 R,。 对 z 和 RR, 也 有 类 似 选择 。 

需要 特别 考虑 的 最 后 一 个 问题 是 当 1 是 复制 指令 x =y 时 的 情况 。 我 们 用 上 面 描述 的 方法 选 
FER, 然后 是 让 R, =R, 

8.6.4 8.6 节 的 练习 
练习 8. 6. 1: 为 下 面 的 每 个 C 语言 赋值 语句 生成 三 地 址 代码 
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J) x = a + bec; 

2) x = a/(btc) - de(etf); 

3)x = ali] + 4; 

4) ali] = b[c[i]]; 

5) ati][j] = bli] [k] + clk] [j]; 

6) *p++ = xq++i 
假设 其 中 的 所 有 数组 元 素 都 是 整数 , 每 个 元 素 占 四 个 字 节 。 在 4 和 5 部 分 , 假设 a、b、c 是 常数 。 
和 在 本 章 之 前 有 关 数 组 访问 的 例子 中 一 样 ， 它 们 给 出 了 同名 数组 的 第 0 个 元 素 的 位 置 。 

| 练习 8. 6.2: 假设 数组 a、b、c 分 别 通 过 指针 pa. pb 和 pc 定位 。 这 些 指针 指向 各 自 数 组 
的 首 元 素 ( 第 0 个 元 素 ) 。 重 复 练习 8.6.1 的 4 和 5 部 分 。 

练习 8. 6. 3: 把 在 练习 8. 6. 1 中 得 到 的 三 地 址 代码 转换 为 本 节 给 出 的 机 器 模型 的 机 器 代码 。 
假设 你 有 任意 多 个 寄存 器 可 用 。 

练习 8. 6. 4: 假设 有 三 个 可 用 的 寄存 器 , 使 用 本 节 中 的 简单 代码 生成 算法 , 把 在 练习 8.6.1 
中 得 到 的 三 地 址 代码 转换 为 机 器 代码 。 请 给 出 每 一 个 步骤 之 后 的 寄存 器 和 地 址 描述 符 。 

练习 8. 6.5: 重复 练习 8.6.4, 但 是 假设 只 有 两 个 可 用 的 寄存 器 。 


8.7 WILKE 


虽然 大 部 分 编译 器 产品 通过 仔细 的 指令 选择 和 寄存 器 分 配 来 生成 优质 代码 , 但 还 有 一 些 纺 
译 器 使 用 另 一 种 策略 : 它们 先生 成 原始 的 代码 ,然后 对 目标 代码 进行 “优化 "转换, 提高 目标 代码 
的 质量 。 这 里 使 用 术语 “优化 "具有 一 定 的 误导 性 ,因为 不 能 保证 得 到 的 代码 在 任何 数学 度量 之 
下 都 是 最 优 的 。 不 管 怎么 说 , 很 多 简单 的 转换 可 以 有 效 地 改善 目标 程序 的 运行 时 间 和 空间 需求 。 

一 个 简单 却 有 效 的 、 用 于 局 部 改进 目标 代码 的 技术 是 宽 孔 优化 (peephole optimization) 。 它 在 
优化 的 时 候 检 查 目 标 指令 的 一 个 滑动 窗口 ( 即 疯 孔 ) ,并且 只 要 有 可 能 就 在 败 孔 内 用 更 快 或 更 短 
的 指令 来 蔡 换 窗口 中 的 指令 序列 。 也 可 以 在 中 间 代 码 生 成 之 后 直接 应 用 罕 孔 优化 来 提高 中 间 表 
示 形 式 的 质量 。 

客 孔 是 程序 上 的 一 个 小 的 滑动 窗口 。 剖 孔 优 化 技术 并 不 要 求 在 宪 孔 中 的 代码 一 定 是 连续 的 ， 
尽管 有 些 实现 要 求 代码 连续 。 额 孔 优化 的 特点 是 每 一 次 改进 又 可 能 产生 出 新 的 优化 机 会 。 一 般 
来 说 , 为 了 获得 最 大 的 好 处 就 需要 多 次 扫描 目标 代码 。 在 本 节 中 , 我 们 将 给 出 下 列 具 有 窒 孔 优化 
特点 的 程序 变换 的 例子 。 

e 元 余 指 令 消 除 

。 控制 流 优化 

e 代数 化 简 

e 机 器 特有 指令 的 使 用 
8.7.1 消除 元 余 的 加 载 和 保存 指令 

如 果 我 们 在 日 标 程序 中 看 到 指令 序列 


LD RO, a 
ST a, RO 


我 们 就 可 以 删除 其 中 的 保存 指令 ,因为 不 管 这 个 保存 指令 何 时 执行 , 第 一 个 指令 将 保证 a 的 值 已 
经 被 加 载 到 寄存 器 RO 中 。 请 注意 , 假如 保存 指令 有 一 个 标号 , 我 们 就 不 能 保证 第 一 个 指令 总 是 
在 第 二 个 指令 之 前 执行 , 因此 不 能 删除 这 个 保存 指令 。 换 句 话说 , 为 了 保证 这 样 的 转换 是 安全 
的 , 这 两 个 指令 必须 在 同一 个 基本 块 内 。 

这 种 类 型 的 元 余 加 载 /保存 指令 不 会 由 前 一 节 中 的 简单 代码 生成 算法 生成 。 但 是 , 一 个 类 似 
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于 8.1.3 节 中 的 原始 的 代码 生成 器 可 能 生成 类 似 的 宛 余 代码 序列 。 
8.7.2 消除 不 可 达 代 码 

田 一 个 帘 孔 优化 的 机 会 是 消除 不 可 达 的 指令 。 一 个 紧 跟 在 无 条 件 跳 转 之 后 的 不 带 标 号 的 指 
令 可 以 被 删除 。 通 过 重复 这 个 运算 ， 比如 ,为 了 调试 的 目的 , 一 个 大 
型 程序 中 可 能 含有 一 些 只 有 当 变 量 debug 等 于 1 时 才 运 行 的 代码 片断 。 在 中 间 表 示 形 式 中 , 这 
个 代码 看 起 来 可 能 就 像 


if debug == i goto Li 
goto L2 
Li: print debugging information 
L2: 


-MEMA LBAL LAL eR HES, Bulk, 不 管 debug 的 值 是 什么 ， 上 面 
的 代码 序列 可 以 被 替换 为 ; 


if debug != 1 goto L2 
print debugging information 
L2: 


如 果 debug 在 程序 开始 的 时 候 被 设置 为 0, 常量 传播 优化 将 把 这 个 序列 转换 为 
if 0 != 1 goto L2 : 
print debugging information 

L23 


现在 , 第 一 个 语句 的 条 件 值 总 是 true， 因 此 这 个 语句 可 以 被 薪 换 为 goto L2. nee 
打印 调试 信息 的 所 有 语 铝 都 变 成 了 不 可 达 语 名 ,因此 可 以 被 逐一 消除 。 
8.7.3 控制 流 优 化 

简单 的 中 间 代 码 生成 算法 经 常生 成 目标 为 无 条 件 跳 转 指令 的 无 条 件 跳 转 指令 , 到 达 条 件 跳 
转 指 令 的 无 条 件 跳 转 指令 , 或 者 到 达 无 条 件 跳 转 指令 的 条 件 跳 转 指令 。 这 些 不 必要 的 跳 转 指令 
可 以 通过 下 面 几 种 半 孔 优化 技术 从 中 间 代 码 或 者 目标 代码 中 消除 。 我 们 可 以 把 序列 


goto Li 





L1: goto L2 
PRA 
goto L2 
Li: gate L2 
如 果 没 有 跳 转 到 L1 的 指令 , 并 且 语 句 LI: goto L2 之 前 是 一 个 无 条 件 跳 转 指 令 , 所 以 可 以 
消除 这 个 语句 。 
类 似 地 , 序列 
if a < b goto L1 
L1: iots L2 
可 以 被 替换 为 序列 
if a < b goto L2 
L1: goto L2 
最 后 , 假设 只 有 一 个 到 达 L 的 跳 转 指 令 , 且 L1 之 前 是 一 个 无 条 件 跳 转 指令 ,那么 序列 


goto Li 


Li: if a < b goto L2 
a: 


可 以 被 替换 为 序列 
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if a < b goto L2 
goto L3 

i e 

虽然 两 个 序列 中 的 指令 个 数 相同 , 但 是 在 第 二 个 序列 中 我 们 有 时 可 以 跳 过 无 条 件 跳 转 指令 ， 
而 在 第 一 个 序列 中 却 不 可 能 。 因 此 , 第 二 个 序列 的 运行 时 间 要 优 于 第 一 个 序列 的 运行 时 间 。 
8.7.4 代数 化 简 和 强度 消减 

在 8.5 节 , 我 们 讨论 了 可 以 用 于 简化 DAC 的 代数 恒等式 。 这 些 代 数 恒 等 式 也 可 以 被 宽 孔 优 
化 器 用 于 消除 罕 孔 中 类 似 于 

x=x+0 


或 者 


x=x* Í 
的 三 地 址 语句 。 

类 似 地 , 强度 消减 转换 也 可 以 应 用 到 窥 孔 中 , 把 代价 比较 高 的 运算 蔡 换 为 目标 机 器 上 代价 较 
低 的 等 从 运算。 有 些 机 器 指令 和 另 一 些 指令 相 比 其 代价 要 低 很 多 , 它们 经 常 被 当 作 相 应 的 高 代 
价 运算 的 特殊 情况 来 使 用 。 比 如 , 用 **x 实现 的 代价 总 是 比 通 过 调用 求 宕 函数 实现 迄 的 代 
价 要 低 。 对 于 乘 数 (除数 ) 为 2 HORAN EE (PRE), 用 移 位 运算 实现 的 代价 要 低 一 些 。 除 
数 为 常数 的 浮 点 除法 可 以 通过 乘 数 为 该 常量 倒数 的 乘法 来 求 近似 值 。 后 一 种 做 法 的 代价 要 小 
一 点 。 
8.7.5 使 用 机 器 特有 的 指令 

目标 机 可 能 会 有 一 些 能 够 高 效 实现 某 些 特定 运算 的 硬件 指令 。 检 测 允 许 使 用 这 些 指 令 的 情 
况 可 以 显著 地 降低 运行 时 间 。 比 如 ， 有 些 机 器 具有 自动 增 量 和 自动 减 量 的 寻 址 模式 。 这 些 指 令 
在 使 用 一 个 运算 分 量 的 值 之 前 或 之 后 , 将 运算 分 量 的 值 自动 加 一 或 减 一 。 在 参数 传递 时 的 压 栈 
或 出 栈 运算 中 使 用 这 个 模式 可 以 大 大 提高 代码 的 质量 。 这 个 模式 也 可 以 在 类 似 于 x =x +1 的 语 
句 的 代码 中 使 用 。 
8.7.6 8.7 节 的 练习 

”练习 8. 7. 1: 构造 一 个 算法 , 它 可 以 在 目标 机 器 代码 上 的 滑动 宕 孔 中 进行 元 余 指 令 消除 。 

练习 8. 7. 2: 构造 一 个 算法 , 它 可 以 在 目标 机 器 代码 上 的 滑动 窥 孔 中 进行 控制 流 优化 。 

练习 8. 7. 3: 构造 一 个 算法 , 它 可 以 在 目标 机 器 代码 上 的 滑动 罕 孔 中 进行 简单 的 代数 简化 和 
强度 消减 。 
8.8 寄存 器 分 配 和 指派 

只 涉及 寄存 器 运算 分 量 的 指令 要 比 那些 涉及 内 存 运算 分 量 的 指令 运行 得 快 。 在 现代 的 机 器 
E, 处 理 器 速度 要 比 内 存 速度 快 一 个 数量 级 以 上 。 因 此 , 寄存 器 的 有 效 利用 对 生成 优质 代码 是 非 
常 重要 的 。 本 节 将 给 出 不 同 的 策略 ,用 于 确定 在 程序 的 每 个 点 上 , 哪个 值 应 该 存放 在 寄存 器 中 
(寄存 器 分 配 ) 以 及 各 个 值 应 该 存放 在 哪个 寄存 器 中 (寄存 器 指派 ) 。 

寄存 器 分 配 和 指派 的 方法 之 一 是 把 目标 程序 中 的 特定 值 分 配给 特定 的 寄存 器 。 比 如 , 我 们 
可 以 确定 把 基地 址 指派 给 一 组 寄存 器 , 算术 计算 则 使 用 另 一 组 寄存 器 , 栈 顶 指针 指派 给 一 个 固定 
的 寄存 器 ,等 等 。 

这 个 方法 的 优点 是 使 代码 生成 器 的 设计 变 得 简单 。 但 因为 它 的 应 用 有 太 多 限制 , 所 以 寄存 
器 的 使 用 效率 较 低 : 有 些 被 占用 的 寄存 器 在 相当 数量 的 代码 运行 中 没有 被 使 用 到 ， 辐 时 却 不 得 不 
生成 很 多 不 必要 的 其 他 寄存 器 的 加 载 和 保存 运算 指令 。 虽 然 如 此 , 在 大 多 数 计算 环境 中 还 是 要 
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保留 一 些 寄存 器 。 这 些 被 保留 的 寄存 器 可 以 被 用 作 基 址 寄存 器 、 栈 顶 指 针 寄存 器 或 其 他 类 似 的 
用 途 。 其 他 寄存 器 则 由 代码 生成 器 在 它 认 为 适当 的 时 候 使 用 。 
8.8.1 全 局 寄存 器 分 配 

8.6 节 中 的 代码 生成 算法 在 单个 基本 块 的 运行 期 间 使 用 寄存 器 来 存放 值 。 但 是 , 在 每 个 基本 
块 的 结尾 处 , 所 有 活路 变量 的 值 都 被 保存 到 内 存 中 。 为 了 省 了 略 一 部 分 这 样 的 保存 及 相应 的 加 载 
指令 , 我 们 可 以 把 一 些 寄存 器 指派 给 频繁 使 用 的 变量 ,并 且 使 得 这 些 寄存 器 在 不 同 基 本 块 中 的 
( 即 全 局 的 ) 指 派 保 持 一 致 。 因 为 程序 的 大 部 分 时 间 花 在 它 的 内 部 循环 上 ,所 以 一 个 自然 的 全 局 
寄存 器 指派 方法 是 试图 在 整个 循环 中 把 频繁 使 用 的 值 存放 在 固定 的 寄存 器 中 。 从 现在 开始 , 假 
设 我 们 知道 一 个 流 图 的 循环 结构 ,并 且 我 们 知道 在 一 个 基本 块 中 计算 的 哪些 值 会 在 该 基本 块 外 
使 用 。 下 一 个 章 将 介绍 用 于 计算 这 些 信 息 的 技术 。 

全 局 寄存 器 分 配 的 策略 之 一 是 分 配 固定 多 个 寄存 器 来 存放 每 个 内 部 牧 环 中 最 活跃 的 值 。 在 
不 同 的 循环 中 所 选择 的 值 也 有 所 不 同 。 没 有 被 分 配 的 寄存 器 可 以 如 8.6 节 中 说 的 那样 用 于 存放 
一 个 基本 块 的 局 部 值 。 这 个 方法 的 缺点 是 固定 的 寄存 器 个 数 并 不 总 是 恰好 等 于 用 于 全 局 寄存 器 
分 配 的 最 佳 数量 。 但 是 这 个 方法 实现 起 来 很 简单 ， 它 曾经 被 用 在 Fortran H 中 。 这 是 IBM 在 20 tit 
纪 60 年 代 后 期 为 360 系列 计算 机 开发 的 Fortran 优化 编译 器 。 

在 早期 的 C te? , 程序 员 可 以 明确 地 参与 某 些 寄存 器 分 配 过 程 。 他 们 使 用 寄存 器 声明 
来 使 得 某 些 值 在 一 个 过 程 运 行 期 间 都 保存 在 寄存 器 中 。 明 智 地 使 用 寄存 器 声明 确实 可 以 提高 很 
多 程序 的 运行 速度 , 但 是 应 该 鼓励 程序 员 在 分 配 寄存 器 之 前 先 获取 程序 的 运行 时 刻 特征 并 确定 
程序 运行 的 热点 代码 。 

8.8.2 使 用 计数 

通过 在 循环 上 运行 时 把 一 个 变量 % 保存 在 寄存 器 里 面 , 我 们 可 以 节省 从 内 存 中 加 载 * 的 开 
销 。 在 本 节 我 们 假设 , WERE * 分 配 在 寄存 器 中 , 对 x 的 每 一 次 引用 可 以 节省 一 个 单位 的 (用 于 
加 载 的 ) 成 本 。 然 而 , 如 果 * 在 一 个 基本 块 中 被 计算 之 后 又 在 同一 个 基本 块 中 被 使 用 , 那么 当 使 
用 8.6 节 中 的 算法 来 生成 基本 块 代码 时 , x 有 很 大 的 机 会 被 仍然 保存 在 寄存 器 中 。( 因 此 对 > 的 
使 用 很 可 能 本 来 就 不 需要 从 内 存 中 加 载 。 一 一 译 者 注 ) 因 此 , RA K r 在 循环 工 的 某 个 基本 块 内 
被 使 用 , 旦 在 同一 基本 块 中 x 没有 被 先行 赋值 时 , 我 们 才 认 为 这 次 使 用 节约 了 一 个 单位 的 开销 。 
如 果 我 们 能 够 避免 在 某 个 基本 块 的 结尾 把 x 保存 回 内 存 , 我 们 也 可 以 省 略 2 个 单位 的 开销 : 保存 
指令 和 之 后 的 加 载 指 令 。 因 此 , WR x 被 分 配 在 某 个 寄存 器 中 , 对 于 每 个 向 x 赋值 且 * 在 其 出 口 
处 活 既 的 基本 块 , 我 们 节省 了 两 个 单位 的 开销 。 

在 支出 方面 , 如果 % 在 循环 头 部 的 入 口 处 活跃 , 我 们 必须 在 进入 循环 世 之 前 把 * 加 载 到 它 的 
寄存 器 中 。 这 个 加 载 的 成 本 是 两 个 成 本 单元 。 类 似 地 ,对 于 循环 上 的 每 个 出 口 基本 块 B, 如 果 * 
在 B 的 某 个 上 之 外 的 后 继 的 入 口 处 活跃 , 我 们 必须 以 2 个 单位 的 代价 把 x 保存 起 来 。 然 而 , 假设 
循环 将 迭代 多 次 , 我 们 可 以 忽略 这 些 支 出 。 因 为 每 次 进入 循环 时 , 这 些 指令 只 会 运行 一 次 。 因 
此 , 在 循环 上 中 把 一 个 寄存 髓 分 配给 x 所 得 到 的 好 处 的 一 个 估算 公 式 是 


use(x,B) +2* live(x,B) (8.1) 
7 中 的 全 部 基本 块 8 


其 中 ,use(x, B8) 是 x 在 B 中 被 定 值 之 前 被 使 用 的 次 数 。 如 果 % 在 B 的 出 口 处 活跃 并 在 B 中 被 赋 
予 一 个 值 , 则 live(x, 8) 的 肥 值 为 1, 否则 live(x, 8) 为 0。 请 注意 , 式 8.1 只 是 一 个 估算 公式 。 这 
是 因为 一 个 循环 中 的 各 基本 块 的 运行 频率 实际 是 不 同 的 , 也 因为 式 (8. 1) 是 基于 循环 被 多 次 迭代 
的 假设 之 上 的 。 因 此 在 特定 的 机 器 上 , 有 可 能 需要 设计 一 个 与 式 (8. 1 ) 类 似 , 但 具有 一 定 差异 的 


公式 。 
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略 了 。 假 设 寄存 器 RO, R1 和 R 用 于 存 
放 整 个 循环 范围 内 的 值 。 为 方便 起 见 , 在 
图 8-17 中 , 各 个 基本 块 的 入 口 处 /出 口 处 
的 活 牙 变量 分 别 显示 在 基本 块 的 上 方 和 下 
方 。 我 们 将 在 下 一 章 中 讨论 关于 活跃 变量 
的 复杂 问题 。 比 如 , 请 注意 e 和 都 在 B; 
的 结尾 处 活跃 , 但 是 只 有 e EB WAJ 
处 活跃 , RA EE B, 的 入 口 处 活跃。 一 
般 来 说 , 在 一 个 基本 块 的 结尾 处 活跃 的 变 
量 集合 是 那些 在 该 基本 块 的 后 继 基本 块 的 
人口 处 活跃 的 变量 的 并 集 。 

为 了 计算 当 x =a 时 式 (8.1) 的 值 , 我 
们 观察 到 a FEB, 的 出 口 处 活跃 且 在 BI 中 


il 8.17 考虑 图 8-17 中 所 示 的 内 部 循环 中 的 基本 块 。 网 中 的 跳 转 指令 和 条 件 跳 转 指令 都 被 省 





b,c,d,e;f 活跃 


图 8-17 一 个 内 层 循环 的 流 图 


被 赋值 ， 但 是 它 不 在 By, B3、 B, 的 出 口 处 活跃 。 因此 ， > preggo eoB) =2。 当 x=a 时 , 
式 (8.1) 的 值 是 4。 也 就 是 说 ,如 果 选 择 某 个 全 局 寄存 器 来 存放 a 的 值 , 可 以 节约 的 4 个 成 本 单 
{io Mb c,d, e f, 式 (8.1) 的 值 分 别 是 5、3、6、4 和 4。 因 此, 我 们 可 以 为 RO、R1、R2 分 
别 选择 a、b、d。 把 R0 用 于 存放 e Mi 是 另 一 种 选择 , 显然 这 样 做 具有 同样 的 收益 。 假 设 8. 6 
节 中 介绍 的 策略 用 于 生成 备 个 基本 块 的 代码 , 图 8-18 显示 了 根据 图 8-17 生成 的 汇编 代码 。 在 图 
8-17 F, 我 们 没有 为 略 去 的 各 个 基本 块 结尾 处 的 条 件 或 无 条 件 跳 转 指令 生成 代码 ,因此 我 们 没有 


像 通 常 那 样 把 代码 显示 成 为 一 个 序列 。 











-一 ~ I 
~ 
LD R3, c 
ADD RO, Rt, 


SUB R3, RO, R2 


ST f, R3 





Sao 


SUB R2, R2, 
LD R3, f 
ADD R3, RO, 
ST e, R3 














< 


LD R3, f 

















O 


Bı 


























ADD R1, R2, R3 
Bo LD R3, C B3 

SUB R3, RO, R3 
ST e, R3 

LD R3, c B ST b, Rt 

ADD R1, R2, 1 ST d, R2 

ST b, Rt 

ST d, R2 


图 8-18 使 用 全 局 寄存 器 指派 的 代码 序列 
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8.8.3 外 层 循 环 的 寄存 器 指派 

在 为 内 层 循环 指派 寄存 器 并 生成 代码 之 后 , 我 们 可 以 把 同样 的 想法 应 用 到 更 大 的 外 围 循环 
上 去 。 如 果 一 个 外 层 循 环 已 包含 一 个 内 层 循 环 L, EL, 中 分 配 的 寄存 器 的 名 字 不 一 定 要 在 L 
~ Ly 部 分 也 分 配 到 一 个 寄存 器 。 然 而 ， 如果 我 们 决定 在 L 中 (而 不 是 在 上 中 ) 为 x 分 配 一 个 寄 
存 器 , 我 们 必须 在 上 的 人 口 处 加 载 x, 而 在 La 的 出 口 处 保存 x。 我 们 把 在 外 层 循环 上 中 选择 为 哪 
些 名 字 分 配 寄存 器 的 标准 留 作 练 习 ， 在 选择 时 假设 已 经 为 所 有 识 套 在 工 内 部 的 循环 完成 了 名 字 
选择 。 

8.8.4 通过 图 着 色 方 法 进行 寄存 器 分 总 

当 计算 中 需要 一 个 寄存 器 , 但 所 有 可 用 寄存 器 都 在 使 用 时 , 某 个 正 被 使 用 的 寄存 器 的 内 容 必 
须 被 保存 (溢出 ) 到 一 个 内 存 位 置 上 , 以 便 释 放出 一 个 寄存 器 。 图 着 色 方 法 是 一 个 可 用 于 分 配 寄 
存 器 和 和 管理 寄存 器 溢出 的 简单 旦 系统 化 的 技术 。 

这 个 方法 需要 进行 两 趟 处 理 。 在 第 一 趟 处 理 中 选择 目标 机 器 指令 ， 处 理 时 假设 有 无 穷 儿 个 
符号 化 寄存 器 。 经 过 这 次 处 理 , 中 间 代 码 中 使 用 的 名 字 变 成 了 寄存 器 的 名 字 , 而 三 地 址 指令 变 成 
了 机 器 指令 。 如 果 对 变量 的 访问 要 求 一 些 指令 使 用 栈 指针 、 显 示 表 指针 、 基 址 寄存 器 或 其 他 的 量 
来 辅助 访问 , 我 们 就 假设 这 些 量 存放 在 那些 为 相应 目的 而 保留 的 寄存 器 中 。 通 常情 况 下 , 它们 的 
使 用 可 以 直接 翻译 成 为 机 器 指令 中 的 一 个 地 址 所 使 用 的 某 种 访问 模式 。 如 果 访 问 方式 更 加 复杂 ， 
这 个 访问 就 必须 被 分 解 成 为 多 个 机 器 指令 , 并且 需要 创建 一 个 或 多 个 临时 的 符号 化 寄存 器 。 

在 选择 好 了 指令 之 后 , 第 二 趟 处 理 把 物理 寄存 器 指派 给 符号 化 寄存 器 。 这 一 次 处 理 的 目标 
是 寻找 到 一 个 溢出 代价 最 小 的 指派 方法 。 

在 第 二 趟 处 理 中 , 对 每 个 过 程 都 构造 了 一 个 寄存 器 冲突 图 (register-interference graph), AF 
的 结 点 是 符号 化 寄存 器 。 对 于 任意 两 个 结 点 , 如 果 一 个 结 点 在 男 一 个 被 定 值 的 地 方 是 活路 的, BB 
么 这 两 个 结 点 之 间 就 有 一 条 边 。 比 如 , 图 8-17 对 应 的 寄存 器 冲突 图 中 有 两 个 结 点 a 和 b。 在 基 
AB, 中 , a 在 对 b 定 值 的 第 二 个 语句 上 是 活跃 的 , 因此 在 图 中 结 点 a 和 上 b 之 间 有 一 条 边 。 

然后 就 可 以 尝试 用 上 种 颜色 对 寄存 器 冲突 图 进行 着 色 , 其 中 此 是 可 指派 的 寄存 器 的 个 数 。 一 
个 图 被 称 为 已 着 色 (colored) 当 且 仅 当 每 个 结 点 都 被 赋予 了 一 个 颜色 ,并 且 没 有 两 个 相 邻 的 结 点 
的 颜色 相同 。 一 种 颜色 代表 一 个 寄存 器 。 着 色 方 案 保证 不 会 把 同一 个 物理 寄存 器 指派 给 两 个 可 
能 相互 冲突 的 符号 化 寄存 器 。 

一 般 来 说 ,确定 一 个 图 是 否 万 可 着 色 是 一 个 NP 完全 问题 , 但 在 实践 中 我 们 常常 可 以 使 用 下 面 
的 启发 式 技 术 进 行 快速 着 色 。 假 设 图 6 中 有 一 个 结 点 mn， 甚 邻居 ( 即 通过 一 条 边 连接 到 的 结 点 ) 个 
数 少 于 个 。 把 n 及 和 相连 的 边 从 6 中 删除 后 得 到 一 个 图 G'。 对 图 C' 的 一 个 天 着 色 方 案 可 以 扩 
展 成 为 一 个 对 C 的 -着 色 方 案 : 只 要 给 n 指派 一 个 尚未 指派 给 它 的 邻居 的 颜色 就 可 以 了 。 

通过 不 断 地 从 寄存 器 冲突 图 中 删除 边 数 少 于 上 的 结 点 , 要 么 最 终 我 们 得 到 一 个 空 图 , BAG 
到 的 图 中 每 个 结 点 都 至 少 有 个 相 邻 的 结 点 。 在 第 一 种 情况 下 , 我 们 可 以 依照 结 点 被 删除 的 相反 
顺序 对 结 点 进行 着 色 ， 从 而 得 到 一 个 原 图 的 上 着 色 方 案 。 在 第 二 种 情况 下 已 经 不 存在 上 着 色 方 
案 了 9 。 此 时 就 需要 通过 引入 保存 和 重新 加 载 寄存 器 的 代码 ,将 某 个 结 点 溢出 。Chaitin 设计 了 多 
个 用 来 选择 溢出 绪 点 的 启发 式 规则 。 总 的 原则 是 避免 在 内 部 循环 中 引 人 滋 出 代码 。 








© 实际 并 非 如 此 , 例如 由 4 个 结 点 组 成 的 贺 中 ,每 个 结 点 都 有 两 条 边 ,但 是 却 存 在 2- 着 色 方案 : 奇数 点 为 白色 ,而 介 
数 点 为 黑色 。 作 者 的 意思 可 能 是 指 难以 在 适当 的 时 间 内 找 出 大 着 色 方案 一 译 者 注 。 
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8.8.5 8.8 节 的 练习 

练习 8. 8. 1: 为 图 8-17 中 的 程序 构造 寄存 器 冲突 图 。 

练习 8. 8. 2 : 假设 我 们 在 每 个 过 程 调用 前 在 栈 中 自动 保存 所 有 的 寄存 器 , 并 在 该 过 程 返回 后 
重新 从 栈 中 恢复 它们 ,请 设计 一 个 寄存 器 分 配 策略 。 


8.9 通过 树 重 写 来 选择 指令 


指令 选择 可 能 是 一 个 大 型 的 排列 组 合 任务 。 对 于 像 CISC 这 样 的 具有 丰富 寻 址 模式 的 机 器 ， 
”或 者 具有 某 些 特殊 目的 指令 (比如 信号 处 理 指令 ) 的 机 器 尤其 如 此 。 即 使 我 们 假设 求 值 的 顺序 已 
经 给 定 , 并 且 假 设 寄存 器 通过 另 一 个 独立 的 机 制 进行 分 配 , 指令 选择 一 一 为 实现 中 间 表 示 形 式 中 
出 现 的 运算 符 而 选择 目标 语言 指令 的 问题 一 -仍然 是 一 个 规模 很 大 的 排列 组 合 任务 。 
在 本 节 中 , 我 们 把 指令 选择 当 作 一 个 树 重 写 问题 来 处 理 。 目 标 指令 的 树 形 表示 已 经 在 代码 
生成 器 的 生成 器 中 得 到 有 效 使 用 。 这 种 生成 器 可 以 依据 目标 机 器 的 高 层 规约 自动 构造 出 一 个 代 
码 生成 器 的 指令 选择 阶段 。 对 于 某 些 机 器 ,相对 于 使 用 树 表示 方法 而 言 , 使 用 DAG 表示 方法 能 
够 生成 更 好 的 代码 。 但 是 DAG 匹配 比 树 匹 配 更 加 复杂 。 
8.9.1 树 翻译 方案 | 
在 这 一 节 中 , 代码 生成 过 程 的 输入 是 一 个 由 目标 机 器 的 语义 层次 上 的 树 组 成 的 序列 。 像 8.3 
节 讨 论 的 那样 在 中 间 代 码 中 插入 运行 时 刻 地 址 之 后 就 可 以 得 到 这 些 树 。 另 外 , 这 些 树 的 叶子 包 
含有 关 它 们 的 标号 的 存储 类 型 的 信息 。 








DAA As 包含 了 一 个 对 应 于 赋值 语句 ae 

ali] =b+1 的 树 , 其 中 数组 a 存放 在 运行 时 刻 a Ban 
栈 中 , 而 b 是 -一 个 存放 在 内 存 位 置 in 的 全 局 变 ze M C 
量 。 局 部 变量 a 和 i 的 运行 时 刻 地 址 是 以 相对 R IE 

于 SP 的 常数 偏 移 量 C, 和 C; 的 方式 给 出 的 , H SN | 

中 sp 是 存放 当前 活动 记录 的 起 始 位 置 的 寄 。 Rsp + 

存 器 。 ae Ns 


对 a[ 1] 的 赋值 是 一 个 间接 赋值 , 其 中 a[ i] 

的 位 置 上 的 右 值 被 设置 成 表达 式 b + 1 的 右 值 。 Bee als |= pad Ee 
数组 a 和 变量 i 的 地 址 是 通过 分 别 把 常量 C。 和 C 的 值 加 上 寄存 器 SP 的 内 容 而 得 到 的 。 为 了 简 
化 数组 地 址 的 计算 , 我 们 假设 每 个 元 素 值 都 是 一 个 字 节 的 字符 ( 某 些 指令 集中 提供 了 特殊 指令 用 
于 在 地 址 计算 中 进行 乘 数 为 某 些 常数 ( 比如 2、4、8 等 ) 的 乘法 运算 ) 。 

在 这 棵 树 中 , 运算 符 ind 把 它 的 参数 作为 内 存 地 址 处 理 。 作 为 一 个 赋值 运算 符 的 左 子 结 点 ， 
ind 结 点 指出 了 一 个 内 存 位 置 , 该 位 置 用 来 存放 赋值 运算 符 右 部 的 右 值 。 如 果 一 个 + 或 者 ind 运 
算 符 的 某 个 参数 是 内 存 位 置 或 寄存 器 , 那么 该 内 存 位 置 或 寄存 器 中 的 内 容 就 是 参数 的 值 。 这 标 
树 的 叶子 结 点 的 标号 为 属性 ,而 下 标 表示 属性 的 值 。 口 

目标 代码 是 通过 应 用 一 个 树 重 写 规则 序列 来 生成 的 , 这 些 规则 最 终 会 把 输入 的 树 归 约 为 音 
个 结 点 。 各 个 树 重 写 规则 形 如 





replacement«—template | action | 
FE", replacement (WRR A) E MiA, template (HEAR) 是 一 棵 树 ，action( 动 作 ) 是 一 个 像 语 
法 制导 翻译 方案 中 那样 的 代码 片断 。 
一 组 树 重 写 规则 被 称 为 一 个 树 翻译 方案 (tree-translation scheme) o 





每 个 树 重 写 规则 表示 了 如 何 翻译 由 模板 给 出 的 输入 树 的 一 个 片段 。 翻 译 中 包含 了 一 组 可 能 
为 空 的 机 器 指令 序列 , 该 序列 由 与 模板 关联 的 动作 发 出 。 和 输入 树 一 样 , 模板 的 叶子 是 带 有 下 标 
的 属性 。 有 时 , 会 存在 一 些 对 于 模板 中 的 下 标 值 的 约束 , 这 些 约束 通过 语义 断言 来 表示 。 只 有 满 
足 这 些 约束 才 可 以 匹配 模板 。 比 如 , 一 个 断言 可 能 规定 某 个 常数 的 值 必须 位 于 某 个 区 间 内 。 

树 翻 译 方案 可 以 很 方便 地 表示 代码 生成 器 的 指令 选择 阶段 。 作 为 树 重 写 规则 的 例子 ,考虑 
关于 寄存 器 到 寄存 器 加 法 指令 的 规则 : 


Roc + 
ASN 
Ri R, 


这 个 规则 按照 如 下 方法 使 用 。 如 果 输 入 树 包含 一 个 和 上 面 的 模板 匹配 的 子 树 , 也 就 是 说 ,有 
一 个 子 树 的 根 结 点 的 标号 是 运算 符 + ， 且 其 左右 子 结 点 是 寄存 器 ; 和 j 中 的 量 , 那么 我 们 可 以 把 
PERRIS HR, 的 单一 结 点 ， 同 时 输出 指令 ADD R, Ri Rj。 我 们 把 这 次 蔡 换 称 为 对 该 
子 树 的 一 次 履 盖 (tiling) 。 在 一 个 给 定时 刻 可 能 有 多 个 模板 与 某 个 子 树 匹 配 , 我 们 将 简要 描述 在 
冲突 情况 下 决定 应 用 哪个 规则 的 一 些 机 制 。 
(ERE) 图 8-20 包含 了 我 们 的 目标 机 上 的 一 部 分 指令 的 树 重 写 规则 。 这 些 规则 将 被 用 于 一 个 
贯穿 本 节 的 例子 中 。 前 面 的 两 个 规则 对 应 于 加 载 指 令 ; 接 下 来 的 两 个 规则 对 应 于 保存 指令 ,其 余 
的 规则 对 应 于 带 有 下 标的 加 载 与 加 法 运算 。 请 注意 , 规则 (8) 要 求 常量 的 值 必须 是 1。 这 个 条 件 


{ ADD Ri, Ri, Rj } 



































将 用 一 个 语义 断言 来 描述 。 口 
5) Ri ind {LD Ri, a(Rj) } 
| 
+ 
> 
Ca R; 
6) Ri = + { ADD Ri, Ri, a(Rj) } 
for 
Ri ind 
| 
+ 
ZON 
a R; 
7) Ri © + { ADD Ri, Ri, Rj } 
人 N 
Ri Ri 
8) & + { INC Ri } 
Z N 
Ri Cı 





图 8-20 一些 目标 机 指令 的 树 重 写 规则 
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8.9.2 ”通过 覆盖 一 个 输入 树 来 生成 代码 

一 个 树 翻译 方案 按照 下 面 的 方式 工作 。 给 定 一 个 输入 树 ,在 这 些 树 重 写 规则 中 的 模板 被 用 
来 覆盖 输入 树 的 子 树 。 如 果 找 到 一 个 匹配 的 模板 ,那么 输入 树 中 匹配 的 子 树 将 被 替换 为 相应 规 
则 中 的 替换 结 点 ， 并 且 执 行规 则 的 相关 动作 。 如 果 这 个 动作 包含 了 一 个 机 器 指令 序列 , 那么 就 会 
生成 这 些 指令 。 这 个 过 程 将 一 直 重 复 , 直到 这 个 树 被 归 约 成 单个 结 点 , 或 找 不 到 匹配 的 模板 为 
止 。 在 将 一 个 输入 树 归 约 成 单个 结 点 的 过 程 中 生成 的 机 器 指令 代码 序列 就 是 树 翻译 方案 作用 于 
_ 给 定 输入 树 而 得 到 的 输出 。 

RA, 描述 一 个 代码 生成 器 的 过 程 就 变 得 和 使 用 语法 制导 翻译 方案 来 描述 翻译 器 的 过 程 类 
似 。 我 们 写 出 一 个 树 翻译 方案 来 描述 目标 机 的 指令 集合 。 在 实践 中 , 我 们 将 试图 找到 一 个 能 够 
对 每 个 输入 树 生成 代价 最 小 的 指令 序列 的 树 翻译 方案 。 现 在 有 很 多 工具 可 以 帮助 我 们 根据 一 个 
树 翻 译 方案 自动 生成 代码 生成 器 。 

DEEI iRNMA 8-20 的 树 翻译 方案 来 为 图 8-19 中 的 输入 树 生成 代码 。 假 设 第 一 个 规则 用 
于 把 常量 C, 加 载 到 寄存 器 Ro 中 : 


1) Ro © Ca { LD RO, #a } 
最 左边 叶子 结 点 的 标号 就 由 C。 变 成 Ro, 同时 生成 了 指令 LD RO, 要。 现在 , 第 七 个 规则 和 最 左 
边 的 根 标 号 为 + 的 子 树 匹配 ; 
7) R & + { ADD RO, RO, SP } 
AN 
Ro Rsp 


使 用 这 个 规则 , 我 们 把 这 棵 子 树 重 写 为 一 个 标号 为 Ro 的 单一 结 点 , 同时 生成 指令 ADD RO, RO, 
SP。 现 在 这 棵 树 如 下 所 示 : 


Z X 
+ My Cy 


NS 
C Rsp 


此 时 , 我 们 可 以 应 用 规则 (5) 来 把 子 树 


> R 
Ci Rsp 
归 约 为 单个 结 点 , 设 其 标号 为 Ri 。 我 们 也 可 以 使 用 规则 (6) 把 较 大 的 子 树 


十 
wg Ss 
Ro ind 
| 
十 
Z N 
Ci Rgp 


归 约 为 单个 结 点 Ro, 并 生成 指令 ADD RO, RO, i(SP) 。 假 设 用 一 个 指令 来 计算 较 大 的 子 树 要 比 
计算 较 小 的 子 树 更 加 高 效 , 我 们 选择 规则 (6) 得 到 下 面 的 树 : 


ind” A: 
| Ye OX 
Ro My, Cy 


在 右边 的 子 树 中 ,可 将 规则 (2) 可 应 用 于 叶子 结 点 M, 并 产生 一 个 把 b 加 载 到 某 个 寄存 器 (比方 
说 R1 ) 的 指令 。 现 在 , 使 用 规则 (8) 我 们 可 以 匹配 子 树 
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an 
Ry Cy 
并 生成 增 量 指令 INC RL, Bik, 输入 树 已 经 肥 被 归 约 成 为 ， 


a 
ind Ry 


| 
Ro 
FF Bs ERA AN LI (4) DCC, 从 而 把 这 棵 树 归 约 为 单个 结 点 , 并 生成 指令 ST * RO, RL AN 
树 归 约 成 为 单一 结 点 的 过 程 中 , 我 们 生成 了 下 列 代码 序列 : 
we a SP 
ADD RO, RO, i(SP) 
LD Ri, b 


INC R1 
ST *RO, Ri 


为 了 实现 对 例 8.18 中 的 树 的 归 约 过 程 , 我们 必须 解决 一 些 和 树 模式 匹配 相关 的 问题 : 
e 如 何 完成 树 模式 匹配 ? 代码 生成 过 程 (在 编译 时 刻 ) 的 效率 依赖 于 树 匹 配 算法 的 
效率 。 
e 如 果 在 某 个 给 定时 刻 有 多 个 模板 可 以 匹配 , 我 们 该 做 什么 ? 生成 的 代码 (在 运行 时 刻 ) 的 
效率 依赖 于 模板 被 匹配 的 顺序 ,因为 不 同 的 匹配 序列 通常 将 产生 不 同 的 目标 机 代码 ， 这 
些 代码 之 间 的 效率 是 不 同 的 。 
如 果 没 有 匹配 的 模板 , 那么 代码 生成 过 程 就 无 法 继续 了 。 在 另 一 种 极端 情况 下 ,我 们 要 防止 
出 现 某 个 单个 结 点 被 重 写 无 穷 多 次 的 可 能 性 。 这 种 情况 会 产生 无 穷 多 个 寄存 器 之 间 的 移动 指令 ， 
或 者 无 穷 多 个 加 载 、 保 存 指令 。 
为 了 避免 阻塞 ,我们 假设 中 间 代 码 中 的 每 个 运算 符 都 能 够 使 用 一 个 或 多 个 县 标 机 器 的 指令 
来 实现 。 我 们 进一步 假设 存在 足够 多 的 寄存 器 用 于 计算 树 的 每 个 结 点 。 那 么 , 不 管 树 匹配 过 程 
如 何 进行 , 剩 下 的 树 总 能 够 被 翻译 成 为 目标 机 器 指令 序列 。 
8.9.3 通过 扫描 进行 模式 匹配 
在 考虑 通用 的 树 匹 配方 法 之 前 , 我 们 先 考虑 一 个 特殊 的 匹配 方法 。 这 个 方法 使 用 LR 语法 分 
析 器 来 完成 模式 匹配 。 输 入 树 可 以 用 前 级 方式 表示 为 一 个 串 。 比 如 ,图 8-19 中 的 树 的 前 级 表 
示 为 : 





[5 

















= ind + + Ca Rgp ind + Ci Rgp + Me Ci 
一 个 树 翻 译 方案 可 以 转换 为 一 个 语法 制导 的 翻译 方案 , 方法 是 把 每 个 树 重 写 规则 替换 为 相 
应 的 上 下 文 无 关 文法 的 产生 式 。 对 于 一 个 树 重 写 规则 , 相应 的 产生 式 的 右 部 就 是 其 指令 模板 的 
前 缀 表示 方式 。 
Ra) 图 8-21 中 的 语法 制导 翻译 方案 是 基于 图 8-20 中 的 树 翻译 方案 构造 的 。 











相应 文法 的 非 终 结 符号 是 尺 和 入。 1) Ri ca {LD Ri, #a} 
终结 符号 m 表示 特定 的 内 存 位 置 , 比如 | 2) > Me papa 
3) M > =M, R; {ST x, Ri} 
例 8.18 中 全 局 变量 b 的 位 置 。 可 以 这 4) M > =ind R; Rj {ST «Ri, Rj} 
么 理解 规则 (10) 中 的 产生 式 Mm: 在 | 日 Rene en, o ae APO 
使 用 涉及 M 的 某 个 模板 之 前 首先 要 把 | D R > +R { ADD Ri, Ri, Rj } 
8) Ri > +Rici { INC Ri } 
M 和 匹配。 类 伏地， 我 们 为 寄存 器 9) R> sp 
sp 引信 终结 符 sp, 并 增加 产生 式 R-， O “mm | 


sp。 最 后 , 终结 符 c 表示 常 量 。 图 8-21 由 图 8-20 构造 得 到 的 语法 制导 翻译 方案 
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使 用 这 些 终结 符 , 图 8-19 中 的 输入 树 对 应 的 串 是 : 
= ind + + ca sp ind + c; sp + my, ci 口 
根据 这 个 翻译 方案 的 产生 式 , 我 们 可 以 使 用 第 4 章 中 的 某 个 LR 语法 分 析 器 构造 技术 来 构建 
一 个 LR 语法 分 析 器 。 目 标 代码 通过 每 一 步 归 约 中 发 出 的 机 器 指令 来 生成 。 

一 个 用 于 代码 生成 的 语法 具有 很 大 的 二 义 性 。 在 构造 语法 分 析 器 的 时 修 , 对 于 如 何 处 理 语法 分 
析 动 作 冲 突 的 问题 要 多 加 小 心 。 在 没有 指令 代价 信息 的 时 候 , 总 体 处 理 规则 是 偏向 于 执行 较 大 的 归 
约 , 而 不 是 较 小 的 规约 。 这 意味 着 在 一 个 归 约 - 归 约 冲突 中 , 优先 选择 较 长 的 妇 约 ; 在 一 个 移 
人 - 归 约 冲突 中 , 优先 选择 移入 动作 。 这 种 “ 贪 吃 ”的 做 法 使 得 多 个 运算 由 一 条 机 器 指令 完成 。 

在 代码 生成 中 使 用 LR 语法 分 析 方 法 有 多 个 好 处 。 第 一 , 语法 分 析 方 法 是 高 效 的 , 并且 容易 
被 人 们 理解 。 因 此 , 使 用 第 4 章 中 描述 的 算法 可 以 构造 出 可 靠 和 高 效 的 代码 生成 器 。 第 二 ， 比 较 
容易 为 所 得 代码 生成 器 重新 确定 目标 。 只 要 写 出 描述 新 机 器 的 指令 集合 的 语法 ,就 可 以 构造 得 
到 一 个 针对 新 机 器 的 代码 选择 器 。 第 三 , 可 以 通过 增加 特殊 产生 式 来 利用 机 器 特有 的 指令 ， 从 而 


， 生 成 高 效 的 代码 。 


但 使 用 这 个 方法 也 存在 着 一 些 挑 战 。 请 法 分 析 方 法 确定 了 求 值 过 程 必须 是 从 左 到 右 的 。 另 
外 , 对 于 某 些 具有 很 多 种 寻 址 模式 的 机 器 来 说 ,描述 机 器 的 文法 和 由 此 得 到 的 语法 分 析 器 可 能 变 
得 异常 庞大 。 其 结果 是 人 们 不 得 不 使 用 特殊 技术 对 描述 机 器 的 文法 进行 编码 和 处 理 。 我 们 还 必 
须 注意 不 要 让 得 到 的 语法 分 析 器 在 对 表达 式 树 进 行 语法 分 析 的 时 候 被 阻塞 ( 即 无 法 进行 下 一 步 动 
YE) 。 造 成 阻塞 的 原因 可 能 是 该 文法 不 能 处 理 某 些 运 算 符 的 模式 ， 也 可 能 是 语法 分 析 器 在 解决 某 
些 语法 分 析 动 作 冲 突 的 时 候 做 出 了 错误 的 选择 。 我 们 必须 保证 语法 分 析 器 不 会 进入 无 限 循 环 ， 
不 停 地 使 用 右 部 只 有 单个 符号 的 产生 式 进 行 归 约 。 无 限 循环 问题 可 以 在 生成 语法 分 析 器 表 的 时 
候 通过 状态 分 裂 技术 来 解决 。 

8. 9.4 用 于 语义 检查 的 例 程 

在 一 个 代码 生成 翻译 方案 中 出 现 的 属性 和 输入 树 中 的 属性 是 一 样 的 。 但 是 翻译 方案 中 的 属 
性 常常 带 有 关于 该 属性 下 标的 取 值 的 限制 。 比 如 ,一 个 机 器 指令 可 能 要 求 某 个 属性 的 值 位 于 特 
定 范围 之 内 , 或 者 两 个 属性 的 取 值 之 间 有 一 定 关 系 。 

这 些 关 于 属性 值 的 限制 可 以 用 断言 来 描述 。 在 进行 归 约 之 前 需要 判断 相应 的 断言 是 否 被 满 
Eo ML, 相对 于 纯 文 法 描述 的 方式 而 言 , 语义 动作 和 断言 的 普遍 使 用 能 够 更 加 灵活 、 更 加 容 
易 地 对 代码 生成 器 加 以 描述 。 可 以 使 用 通用 模板 来 描述 各 类 指令 , 然后 使 用 语义 动作 来 为 特定 
情况 选择 指令 。 比 如 , 两 种 不 同 的 加 法 指令 可 以 用 同一 个 模板 来 表示 : 

， roe 
a Ne A else 











Ri - 


ADD Ri, Ri, #a } 

可 以 通过 特定 的 断言 来 消除 二 义 性 , 解决 语法 分 析 - 动作 的 冲突 问题 。 这 些 断 言 允许 在 
不 同 的 上 下 文中 使 用 不 同 的 选择 策略 。 因 为 目标 机 体系 结构 的 某 些 方面 (比如 寻 址 模式 ) 可 以 
用 属性 值 来 描述 , 所 以 对 上 且 标 机 器 的 描述 可 以 变 得 更 小 。 这 种 方法 的 复杂 之 处 在 于 人 们 难以 
验证 该 翻译 方案 是 否 可 靠 地 描述 了 目标 机 器 。 当 然 , 所 有 的 代码 生成 颖 都 会 或 多 或 少 地 碰 到 
这 个 问题 。 

8.9.5 通用 的 树 匹配 方法 

基于 前 缀 表示 的 用 于 模式 匹配 的 LR 语法 分 析 方法 优先 处 理 双 目 运算 符 的 左 运算 分 量 。 在 一 
个 前 缀 表示 op E E 中 , 有 限 向 前 看 的 LR 语法 分 析 方 法 中 有 关 扫 描 动 作 的 决定 必须 依据 El 的 
某 个 前 缀 做 出 。 这 是 因为 £| 可 能 具有 任意 长 度 。 右 运算 分 量 可 能 会 带 来 一 些 能 够 在 目标 指令 集 
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中 选择 较 好 指令 的 机 会 。 但 是 模式 匹配 方法 可 能 会 错失 这 些 机 会 。 

我 们 也 可 以 弃 用 前 级 表示 方式 而 使 用 后 缀 表示 。 但 是 ,一 个 用 于 模式 匹配 的 LR 语法 分 析 方 
法 会 优先 处 理 右 运算 分 量 。 

对 于 一 个 手写 的 代码 生成 器 , 我 们 可 以 使 用 图 8-20 中 所 示 的 树 模板 作为 指南 ,编写 一 个 专 
门 的 匹配 程序 。 比 如 ,如 果 输入 树 的 根 的 标号 是 ind, 那么 唯一 能 够 匹配 的 是 规则 5 的 模式 ; 否 
则 如 果 根 的 标号 是 + , 那么 可 能 匹配 的 是 规则 6 ~ 8 的 模式 。 

对 于 一 个 可 以 生成 代码 生成 器 的 生成 器 ,我们 需要 一 个 通用 的 树 匹配 算法 。 通 过 扩展 第 3 章 
中 介绍 的 串 模 式 匹配 技术 , 我 们 可 以 开发 出 一 个 高 效 的 自 项 向 下 算法 。 其 基本 思想 是 把 每 个 模 
板 表示 成 一 个 串 的 集合 , 其 中 每 个 串 对 应 于 模板 中 的 一 条 从 根 到 某 个 叶 结 点 的 路 径 。 通 过 在 串 
中 (从 左 到 右 地 ) 为 每 个 子 结 点 加 入 位 置 编号 , 我 们 平等 地 处 理 每 个 运算 分 量 。 

DRA 在 为 一 个 指令 集 构建 中 集合 的 时 候 , 我 们 将 去 掉 下 标 。 因 为 进行 模式 匹配 时 只 考虑 
属性 , 而 不 考虑 它们 的 值 。 


























图 8-22 中 的 模板 有 如 下 的 从 根 到 叶子 [p CR + Rae + 
a | ae Be ea Ne 

IR | : 

+2ind1+1C AN 

+2ind1+2R Ci Rj 

+2R 

串 C 表示 以 C 为 根 的 模板 。 串 + 1 RH 图 8-22 一 个 用 于 树 匹 配 的 指令 集 
示 以 + 为 根 的 两 个 模板 中 的 + 号 和 它 的 左 运算 分 量 R。 

使 用 例 8. 22 中 的 串 集合 可 以 构造 出 一 个 树 模 式 匹 配 程 序 。 该 程序 使 用 了 可 以 高 效 地 并 行 匹 
配 多 个 串 的 技术 。 


在 实践 中 , 树 重 写 过 程 可 以 按照 如 下 方法 实现 : 对 输入 树 进 行 深度 优先 遍历 的 同时 运行 树 模 
式 匹 配 程序 , 并 且 在 最 后 一 次 访问 这 个 结 点 的 时 候 进行 归 约 。 

如 果 要 考虑 指令 代价 的 问题 , 可 以 给 每 个 树 重 写 规 则 关联 一 个 代价 值 。 这 个 值 等 于 应 用 这 
个 规则 时 所 产生 的 代码 序列 的 总 代价 。 在 8. 11 节 中 , 我 们 将 讨论 一 个 可 以 和 树 模式 匹配 算法 联 
合 使 用 的 动态 规划 算法 。 

通过 并 发 地 运行 该 动态 规划 算法 , 我 们 可 以 使 用 各 个 规则 相关 的 代价 信息 来 选择 一 个 
最 优 的 匹配 序列 。 我 们 要 在 各 个 候选 序列 的 代价 值 都 确定 之 后 再 决定 使 用 哪个 匹配 序列 。 
使 用 这 个 方法 , 可 以 根据 一 个 树 重 写 方 案 快 速 地 构造 出 一 个 小 而 高 效 的 代码 生成 器 。 不 仅 
如 此 ,动态 规划 算法 使 得 代码 生成 器 的 设计 者 不 需要 再 去 解决 匹配 冲突 的 问题 , 或 者 决定 
求 值 的 顺序 。 

8.9.6 8.9 SHAS 

练习 8. 9. 1: 为 下 面 的 语句 构造 抽象 语法 树 。 假 设 所 有 不 是 常量 的 运算 分 量 都 存放 在 内 存 中 。 

l)x=sax*b+cxd; 

2) x[i] = y[j] * zÍk]; 

3)x=x+1; 

使 用 图 8-20 中 的 树 重 写 方案 来 为 每 个 语句 生成 代码 。 

练习 8. 9. 2: 使 用 图 8-21 中 的 语法 制导 翻译 方案 来 蔡 代 树 翻 译 方案 , 重复 练习 8. 9. 1。 

! 练习 8. 9. 3: 扩展 图 8-20 中 的 树 重 写 方案 , 使 之 可 应 用 于 while 语句 。 

! 练习 8. 9. 4: 扩展 树 重 写 技术 使 之 应 用 于 DAC, 
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8.10 ”表达 式 的 优化 代码 的 生成 


当 一 个 基本 块 仅 包含 单一 的 表达 式 求 值 时 , 或 者 我 们 认为 以 逐次 处 理 各 个 表达 式 的 方式 为 
基本 块 生成 代码 就 已 经 足够 了 ,那么 我 们 就 可 以 最 佳 地 选择 寄存 器 。 在 下 面 的 算法 中 , 我们 引入 
对 一 个 表达 式 树 ( 即 一 个 表达 式 的 语法 树 ) 的 结 点 添加 数字 标号 的 方案 。 在 使 用 固定 个 数 的 寄存 
器 来 对 一 个 表达 式 求 值 的 情况 下 , 该 方案 允许 我 们 为 表达 式 生成 最 优 的 代码 。 

8.10.1 Ershov 数 

一 开始 , 我 们 给 一 个 表达 式 树 的 每 个 结 点 各 赋予 一 个 数值 。 该 数 表示 如 果 我 们 不 把 任何 临 
时 值 存放 回 内 存 的 话 , 计算 该 表达 式 需要 多 少 个 寄存 器 。 这 些 数 有 时 被 称 为 Ershov 数 ( Ershov 
number) 。 这 是 根据 A. Ershov 命名 的 , 他 为 只 有 一 个 算术 寄存 器 的 机 器 使 用 了 类 似 的 方案 。 对 我 
们 的 机 器 模型 而 言 , 计算 Ershov 数 的 规则 如 下 : 

1) 所 有 叶子 结 点 的 标号 为 1。 

2) 只 有 一 个 子 结 点 的 内 部 结 点 的 标号 和 其 子 结 点 的 标号 相同 。 

3) 具有 两 个 子 结 点 的 内 部 结 点 的 标号 按照 如 下 方式 确定 : 

D 如 果 两 个 子 结 点 的 标号 不 同 , 那么 选择 较 大 的 标号 。 

O 如 果 两 个 子 结 点 的 标号 相同 , 那么 它 的 标号 就 是 子 结 点 的 标号 值 加 一 。 

PRA 在 图 8-23 中 , 我 们 可 以 看 到 一 个 表达 式 树 (其 中 的 运算 符 已 经 被 省 略 ) 。 这 个 树 可 能 
是 表达 式 (a -5) +e x (c+d) 的 树 , 或 者 说 是 下 面 的 三 地 址 代码 的 树 : 

ti=a-b 

t2 =c#e 


t3 =e * t2 
t4 = ti + t3 


根据 规则 (1) , 该 树 的 五 个 叶子 结 点 的 标号 都 是 
1。 然 后 , 我 们 可 以 给 对 应 于 tl =a -pb 的 内 部 
结 点 加 上 标号 , 因为 它 的 两 个 子 结 点 都 已 经 被 加 
上 了 标号 。 应 用 规则 3, 该 结 点 的 标号 是 它 的 子 
结 点 的 标号 加 上 1, 也 就 是 2。 对 应 于 t2 =c +d 
的 结 点 的 标号 的 计算 方式 与 此 类 似 。 

现在 我 们 可 以 计算 对 应 于 t3 = ex t2 的 结 点 的 标号 。 它 的 子 结 点 的 标号 是 1 和 2, 因此 根 
据 规 则 3，t3 对 应 结 点 的 标号 是 其 中 的 较 大 值 , 即 2。 最 后 计算 根 结 点 , 即 对 应 于 54 = tl + t3 
的 结 点 。 它 的 两 个 子 结 点 的 标号 都 是 2, 因此 它 的 标号 是 3。 o 
8.10.2 ”从 带 标号 的 表达 式 树 生成 代码 

假设 在 我 们 的 机 器 模型 中 , 所 有 的 运算 分 量 都 必须 在 寄存 器 中 , 且 寄 存 器 可 以 同时 用 于 存放 
某 个 运算 的 运算 分 量 和 结果 。 可 以 证 明 , 如 果 在 计算 表达 式 的 过 程 中 不 允许 把 中 间 结 果 保存 回 
内 存 , 那么 一 个 结 点 的 标号 就 等 于 计算 该 结 点 对 应 的 表达 式 时 需要 的 最 少 的 寄存 器 个 数 。 因 为 
在 这 个 机 器 模型 中 , 我 们 必须 把 每 个 运算 分 量 加 载 到 寄存 器 中 , 且 必 须 计算 每 个 内 部 结 点 所 对 应 
的 中 间 结 果 , 所 以 , 造成 生成 代码 不 是 最 优 代码 的 唯 -- 可 能 是 我 们 使 用 了 不 必要 的 将 临时 结果 存 
回 内 存 的 指令 。 对 这 个 断言 的 证 明 包 含 在 下 面 的 算法 中 。 这 个 算法 生成 的 代码 不 包含 将 临时 结 
果 存 回 内 存 的 指令 ， 而 这 个 代码 所 使 用 的 寄存 器 数目 就 是 根 结 点 的 标号 。 
根据 一 个 带 标号 的 表达 式 树 生成 代码 。 

输入 : 一 个 带 有 标号 的 表达 式 树 , 其 中 的 每 个 运算 分 量 只 出 现 一 次 ( 即 没有 公共 子 表达 式 ) 。 








图 8-23 一 个 用 Ershov 数 标号 的 树 
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输出 : 计算 根 结 点 对 应 的 值 并 将 该 值 存放 在 一 个 寄存 器 中 的 最 优 的 机 器 指令 序列 。 

方法 : 下 面 是 一 个 用 来 生成 机 器 代码 的 递归 算法 。 从 树 的 根 结 点 开始 应 用 下 面 的 步骤 。 如 
果 算法 被 应 用 于 一 个 标号 为 的 结 点 , 那么 得 到 的 代码 只 使 用 个 寄存 器 。 然 而 , 这 些 代码 从 某 
个 基线 (bE 1) 开始 使 用 寄存 器 , 实际 使 用 的 寄存 器 是 已 ，R 41，…， Ri ,i_1。 计算 结果 总 是 存 
放 在 Ry yp Fo 

1) 为 一 个 标号 为 丰 且 两 个 子 结 点 的 标号 相同 (它们 的 标号 必然 是 上 - 1) 的 内 部 结 点 生成 代码 
时 ， 做 如 下 处 理 ; 

© 使 用 基线 5 + 1 递归 地 为 它 的 右 子 树 生成 代码 。 其 右 子 树 的 结果 将 存放 在 寄存 器 Rito 

O 使 用 基线 5， 递归 地 为 它 的 左 子 树 生成 代码 。 其 左 子 树 的 结果 将 存放 在 寄存 器 R, ,4 9 Po 

@ ERIS OP Ry peers R44k-2, Rover”, 其 中 OP 是 标号 为 上 的 结 点 对 应 的 运算 。 

2) 假设 我 们 有 一 个 标号 为 上 的 内 部 结 点 ,其 子 结 点 的 标号 不 相等 。 那 么 , 它 必然 有 一 个 子 
结 点 的 标号 为 上 ,我 们 称 之 为 "大 子 结 点 "; 而 另 一 个 子 结 点 的 标号 为 某 个 mck, 它 被 称 为 “小 子 
结 点 " 。 使 用 基线 ，， 通 过 下 列 步骤 为 这 个 内 部 结 点 生成 代码 

O 使 用 基线 6, 递归 地 为 大 子 结 点 生成 代码 , 其 结果 存放 在 寄存 器 Ri Po 

@ 使 用 基线 5, 递归 地 为 小 子 结 点 生成 代码 ,其 结果 存放 在 寄存 锅 R, ,1 中 。 请 注意 , 因为 
m <k, 寄存 器 R, ,4 -1 和 编号 更 高 的 寄存 器 都 没 有 被 使 用 。 

@ 根据 大 子 结 点 是 该 内 部 结 点 的 右 子 结 点 还 是 左 子 结 点 , 分 别 生 成 指令 “OP Ry 
Rysmaie Rort-1 或 者 “OP Regis Rosk- Rorm-l 0 

3) 对 于 代表 运算 分 量 * 的 叶子 结 点 ， 当 基线 为 上 时 生成 指令 "LD Ry, x”。 口 
CEE 让 我 们 把 算法 8. 24 应 用 于 图 8-23 中 的 树 。 因 为 根 结 点 的 标号 是 3， 其 结果 将 存放 在 
Rs H, 并且 只 有 寄存 器 RI、R,、Rs 被 使 用 。 根 结 点 的 基线 是 5 = 1。 因 为 根 结 点 的 两 个 子 结 点 的 
标号 相同 , 我 们 首先 以 2 为 基线 生成 右 子 结 点 的 代码 。 

当 我 们 为 根 结 点 的 标号 为 B 的 右 子 结 点 生成 代码 时 , 我 们 发 现 该 子 结 点 的 大 子 结 点 是 其 右 























子 结 点 ， 而 小 子 结 点 是 其 左 子 结 点 。 这 样 , 我 们 首先 以 2 为 基 fi ma. 
线 生 成 右 子 结 点 的 代码 。 应 用 针对 具有 相同 标号 子 结 点 和 叶 De 
子 结 点 的 规则 , 我 们 为 标号 2 的 结 点 生成 下 列 代码 : 

LD R3, d MUL R3, R2, R3 

LD R2, ¢ LD R2, b 

ADD R3, R2, R3 LD Ri, a 
接 下 来 ,我们 为 根 结 点 的 右 子 结 点 的 左 子 结 点 生成 代码 。 这 re eee 
是 一 个 标号 为 。 的 叶子 结 点 。 因 为 =2， 正确 的 指令 是 ice 

LD: R28 El 8-24 图 8-23 中 的 树 的 
现在 我 们 加 上 指令 最 优 的 三 地 址 代码 


MUL R3, R2, R3 
就 完整 地 生成 了 根 结 点 的 右 子 结 点 的 代码 。 算 法 继续 以 1 为 基线 生成 根 结 点 的 左 子 结 点 的 代码 ， 
并 把 结果 放 在 R 中 。 图 8-24 中 显示 了 生成 的 全 部 指令 序列 。 Oo 
8.10.3 寄存 器 数量 不 足 时 的 表达 式 求 值 

当 可 用 寄存 器 的 数量 少 于 树 的 根 结 点 的 标号 时 ,我 们 不 能 直接 应 用 算法 8.24。 此 时 需要 引 
人 一 些 保存 指令 ， 把 某 些 子 树 的 值 滋 出 到 内 存 中 , 然后 在 必要 的 时 候 生成 加 载 指令 把 那些 值 再 加 
载 到 寄存 器 中 。 下 面 是 一 个 经 过 修改 的 代码 生成 算法 , 它 考虑 了 寄存 器 数量 的 限制 。 
Epa RET PREM ARERR. 
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输入 : 一 个 带 有 标号 的 表达 式 树 和 寄存 器 的 数量 ">>2。 表 达 式 树 的 每 个 运算 分 量 只 出 现 -- 
次 ( 即 没有 公共 子 表达 式 ) 。 

输出 : 计算 根 结 点 对 应 的 值 并 将 其 存放 到 一 个 寄存 器 中 的 最 优 的 机 器 指令 序列 。 代 码 使 用 
的 寄存 器 的 数量 不 大 于 r。 我 们 假设 这 些 寄 存 器 为 Ri, Ras o, Reo 

方法 : SH b= 1, 从 根 结 点 开始 应 用 下 面 的 递归 算法 。 对 于 标号 为 + 或 者 更 小 的 结 点 N， 
本 算法 和 算法 8.24 完全 一 样 , 这 里 不 再 重复 。 但 是 , 对 于 标号 >7 的 内 部 结 点 , 我 们 要 分 别处 
理 该 内 部 节点 的 各 个 子 结 点 , 并 把 较 大 子 树 的 结果 保存 到 内 存 中 。 该 结果 在 对 结 点 N 求 值 之 前 
才 从 内 存 重新 加 载 , 而 最 后 的 求 值 步骤 将 在 R,_1 和 R, 内 进行 。 对 于 基本 算法 的 改动 如 下 : 

1) 结 点 入 至少 有 一 个 子 结 点 的 标号 为 + 或 者 大 于 r。 选 择 较 大 的 子 结 点 (如 果子 结 点 标号 相 
同 则 选择 任意 一 个 ) 作 为 “大 " 子 结 点 , 并 把 男 外 一 个 子 结 点 作为 “小 ” 子 结 点 。 

2) 令 基 线 b=1, 递归 地 为 大 子 结 点 生成 代码 。 这 个 求 值 的 结果 将 存放 在 寄存 器 R 中 。 

3) 生成 机 器 指令 "Sr y R”, Softy, 是 一 个 用 于 存放 中 间 结 果 的 临时 变量 。 这 个 变量 用 于 
对 标号 为 上 的 结 点 求 值 。 

4) 按照 如 下 方式 为 小 子 结 点 生成 代码 。 如 果 小 子 结 点 的 标号 大 于 或 等 于 +, 选取 基线 b=1。 
如 果 小 子 结 点 的 标号 为 j<r, 选取 基线 5 =r -j。 然 后 递归 地 把 本 算法 应 用 于 小 子 结 点 , 其 结果 存 
放 在 R, 中 。 

5) 生成 指令 “LD Ri, ti”。 

6) 如 果 大 子 结 点 是 NN 的 右 子 结 点 ,生成 指令 “OP RR, R 1”。 如 果 大 子 结 点 是 WEF 
结 点 ,生成 代码 “OP R,, R,_1, R,”。 
DEEA BUELL = 2, 让 我 们 重新 回顾 一 下 图 8-23 所 代表 的 表达 式 。 也 就 是 说 ,只 有 寄存 器 
Rl 和 R2 可 以 用 来 存放 表达 式 求 值 过 程 中 产生 的 临时 结果 。 当 我 们 把 算法 8. 26 应 用 到 图 8-23 中 
时 , 我 们 看 到 根 结 点 的 标号 (3) 大 于 + =2。 这 样 , 我 们 需要 选择 其 中 的 一 个 子 结 点 作为 大 子 结 点 。 
因为 子 结 点 的 标号 相同 , 我们 可 以 任 选 其 中 的 一 个 。 假 设 我 们 选择 了 右 子 结 点 作为 大 子 结 点 。 

因为 根 结 点 的 大 子 结 点 的 标号 为 2, 因此 寄存 器 是 够 用 的 。 我 们 把 算法 8. 24 应 用 到 这 个 子 
树 , 其 中 基线 b=1, 而 寄存 器 个 数 为 2。 最 终 的 结果 和 我 们 在 图 8-24 中 生成 的 代码 很 相似 , 但 原 
来 的 寄存 器 R2 和 R3 被 替换 为 R1 和 R2。 代 码 如 下 : 


LD R2, d 
ED. RL, < 
ADD R2, Ri, R2 
LD Ri, e 
MUL R2, R1, R2 


现在 , 因为 我 们 要 把 这 两 个 寄存 器 都 用 于 根 结 点 的 左 子 树 , 我 们 需要 生成 指令 


ST t3, R2 LD R2, d 
LD Ri, c 




















接 下 来 处 理 根 结 点 的 左 子 结 点 。 同 样 寄存 器 的 数量 足以 处 理 这 个 ADD R2 Ri, R2 
子 结 点 ,代码 如 下 : LD Ri, e 
LD R2, b MUL R2, R1, R2 
LD Ri, a ST t3, R2 
SUB R2, R1, R2 a a : 
最 后 , 我 们 用 指令 SUB R2，R1，R2 
LD Ri, t3 LD Ri, t3 
把 存放 了 根 结 点 的 右 子 结 点 的 值 的 临时 变量 重新 加 载 到 寄存 器 中 ， | 和 
并 使 用 指令 图 8-25 ”图 8223 中 的 树 的 
ADD R2, R2, R1 最 优 的 三 寄存 器 代码 


执行 树 的 根 结 点 上 的 运算 。 完 整 的 指令 序列 显示 在 图 8-25 中 。 O (只 使 用 两 个 寄存 器 ) 
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8.10.4 8.10 节 的 练习 
练习 8.10.1: 计算 下 列表 达 式 的 Ershov 数 。 
1) a/(b +c)-d *(e+f) 
2)a+b*(c*(d+e)) 
3) (-a+ *p) *((b- *q)/(-ct *r)) 
练习 8. 10.2: 使 用 两 个 寄存 器 为 练习 8. 10. 1 中 的 各 个 表达 式 生 成 最 优 的 代码 。 
练习 8. 10. 3: 使 用 三 个 寄存 器 为 练习 8.10.1 中 的 各 个 表达 式 生 成 最 优 的 代码 。 
| 练习 8. 10.4: 将 Ershov 数 的 计算 方法 一 般 化 , 使 之 能 够 处 理 其 中 某 些 内 部 结 点 具有 三 个 
或 更 多 的 子 结 点 的 表达 式 树 。 
| 练习 8. 10.5; 类 似 于 ali] =x 的 对 数组 元 素 的 赋值 看 起 来 像 一 个 具有 三 个 运算 分 量 (&， 
i 和 x) 的 运算 符 。 你 将 如 何 修 改 给 表达 式 树 添加 标号 的 方案 ,以 便 为 这 种 机 器 模型 生成 最 优 的 
代码 ? 
| 练习 8. 10.6: 最 初 的 Ershov 数 技术 所 应 用 的 机 器 模型 和 书 中 的 模型 有 所 不 同 。 该 模型 允 


式 树 添 加 标号 的 方案 , 使 得 它 可 以 为 这 种 机 器 模型 生成 最 优 代 码 ? 

! 练习 8. 10.7: 某 些 机 器 要 求 使 用 两 个 寄存 器 来 存放 某 些 单 精 度 值 。 假 设 单 寄存 器 值 的 乘 
法 的 结果 需要 两 个 连续 的 寄存 器 , 而 当 我 们 计算 a/b 时 , a 的 值 必须 存放 在 两 个 连续 的 寄存 器 中 。 
你 将 如 何 修改 为 表达 式 树 添 加 标号 的 方案 , 使 得 它 可 以 为 这 种 机 器 模型 生成 最 优 代码 ? 


8. 11 使 用 动态 规划 的 代码 生成 


8. 10 节 中 的 算法 8. 26 根据 一 个 表达 式 树 生成 最 优 代 码 所 需 的 时 间 是 树 的 大 小 的 线性 函数 。 
适合 使 用 这 个 过 程 的 机 器 要 满足 以 下 假设 : 所 有 的 计算 都 在 寄存 器 中 完成 ， 而 指令 中 包含 的 运算 
符 要 么 作用 于 两 个 寄存 器 , 要 么 作用 于 一 个 寄存 器 和 一 个 内 存 位 置 。 

基于 动态 规划 原理 的 算法 可 以 应 用 到 更 多 类 型 的 机 器 上 , 使 得 人 们 可 以 在 线性 时 间 内 为 一 
个 表达 式 树 生成 最 优 代码 。 动 态 规划 算法 可 以 被 应 用 到 具有 复杂 指令 集 的 多 种 计算 机 上 。 

只 要 一 个 机 器 具有 7 个 可 互 换 的 寄存 器 RO，R1,…, Rr -1 以 及 加 载 、 保 存 和 运算 指令 , 就 
可 以 应 用 基于 动态 规划 的 算法 为 这 个 机 器 生成 代码 。 为 简单 起 见 , 我 们 假设 每 个 指令 的 代价 是 
一 个 成 本 单位 。 然 而 , 即使 每 个 指令 具有 不 同 的 代价 值 , 人 们 也 可 以 很 容易 地 修改 这 个 算法 来 处 
理 这 种 情况 。 

8.11.1 连续 求 值 

动态 规划 算法 把 为 一 个 表达 式 生 成 最 优 代码 的 问题 分 解 成 为 多 个 为 该 表达 式 的 子 表达 式 生 
成 最 优 代码 的 子 问题 。 作 为 一 个 简单 的 例子 , 考虑 一 个 形 如 E + E 的 表达 式 E。E 的 一 个 最 优 
程序 由 El 和 E, 的 最 优 程序 以 某 种 顺序 组 合 而 成 ,然后 是 对 + 求 值 的 代码 。 为 E， ME, 生成 最 
优 程序 的 子 问题 也 以 类 似 的 方式 解决 。 

由 动态 规划 算法 产生 的 最 优 程序 有 一 个 重要 的 性 质 。 该 代码 以 “连续 "的 方式 计算 表达 式 
= op E,。 我 们 可 以 通过 查看 的 语法 树 了 来 理解 这 句 话 的 含义 。 


> Crane 


这 里 ，7 MT, 分 别 是 El ME, 的 语法 树 。 
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我 们 说 一 个 程序 连续 计算 一 棵 树 7, 如 果 它 首先 计算 那些 需要 计算 值 并 将 其 存放 到 内 存 中 
的 7 了 的 子 树 。 然 后 , 它 再 计算 7 的 其 余部 分 , 计算 的 顺序 可 以 是 T, T, RAR, RE T, T, 
根 结 点 。 无 论 在 哪 种 情况 下 , 作为 非 连 续 计算 的 一 个 例子 , 程序 P 可 能 先 计算 T, 的 -一部分 并 把 
结果 存放 在 一 个 寄存 器 中 (而 不 是 内 存 中 )， 然 后 计算 7 ,然后 再 回 过 来 计算 7 的 其 余部 分 。 

对 于 本 节 中 的 寄存 器 机 器 , 我 们 可 以 证 明 对 于 任何 一 个 计算 表达 式 树 了 的 机 器 语言 程序 P， 
我 们 都 可 以 找到 一 个 等 价 的 程序 P, 使 得 

1) 己 的 代价 不 高 于 尸 的 代价 。 

2) P' 使 用 的 寄存 器 不 多 于 了 使 用 的 寄存 器 , 而且 

3) P' 连 续 地 对 该 树 求 值 。 

这 个 结果 表明 ,每 个 表达 式 树 可 以 用 一 个 连续 程序 最 优 地 求 值 。 

相对 而 言 ,使 用 偶数 - 奇数 寄存 器 对 的 计算 机 不 一 定 总 是 具有 最 优 的 连续 求 值 过 程 。x86 体 
系 结构 在 乘法 和 除法 中 使 用 寄存 器 对 。 对 于 这 样 的 机 器 , 我 们 可 以 给 出 一 些 表达 式 树 的 例子 。 
这 些 树 的 最 优 机 器 语言 程序 必须 首先 对 根 的 左 子 树 的 一 部 分 进行 求 值 并 把 结果 存放 到 寄存 器 中 ， 
然后 处 理 右 子 树 的 一 部 分 , 再 处 理 左 子 树 的 另 一 部 分 ， 如 此 往复 。 使 用 本 节 中 的 机 器 对 任意 一 个 
表达 式 树 进行 最 优 求 值 时 ,没有 必要 进行 这 种 类 型 的 摆动 。 

上 面 定义 的 连续 求 值 的 性 质保 证 了 对 于 任何 表达 式 树 7,， 总 是 存在 一 个 最 优 程序 。 这 个 程序 
由 根 结 点 的 子 树 的 最 优 程序 组 成 , 最 后 是 计算 根 结 点 值 的 指令 。 这 个 性 质 支持 我 们 使 用 一 个 动 
态 规划 算法 为 了 生成 一 个 最 优 程序 。 

8.11.2 动态 规划 的 算法 

动态 规划 算法 有 三 个 步骤 (假设 目标 机 器 具有 r 个 寄存 器 ) : 

1) 对 表达 式 树 7 的 每 个 结 点 n 自 底 向 上 地 计算 得 到 一 个 代价 数组 C, 其 中 C 的 第 i 个 元 素 
C[ 引 是 在 假设 有 i(1<i<r) 个 可 用 寄存 器 的 情况 下 对 以 n 为 根 的 子 树 $ 求 值 并 将 结果 存放 在 一 
个 寄存 器 中 的 最 优 代价 。 

2) 遍历 7, 使 用 代价 向 量 (数组 ) 来 决定 T 的 哪 棵 子 树 应 该 被 计算 并 保存 到 内 存 中 。 

3) 使 用 每 个 结 点 的 代价 向 量 和 相关 指令 来 遍历 各 棵 子 树 并 生成 最 终 的 目标 代码 。 在 这 个 过 
程 中 , 首先 为 那些 需要 把 结果 值 保存 到 内 存 的 子 树 生成 代码 。 

上 述 每 一 个 步骤 都 可 以 高 效 地 实现 , 运行 所 需 时 间 与 表达 式 树 的 大 小 成 线性 关系 。 

计算 一 个 结 点 ”的 代价 包括 在 给 定 寄存 器 数量 的 情况 下 对 5 求 值 时 所 需要 的 全 部 加 载 和 保 
存 运算 , 也 包括 了 计算 S 的 根 结 点 处 的 运算 符 所 需要 的 代价 。 代 价 向 量 的 第 0 个 元 素 存放 的 是 把 
子 树 S 的 值 计算 出 来 并 保存 到 内 存 的 最 优 代价 。 只 需要 考虑 S 的 根 结 点 的 各 子 树 的 最 优 程序 的 
不 同 组 合 , 就 可 以 生成 $ 的 最 优 程序 。 这 是 由 连续 求 值 的 性 质 来 确保 的 。 这 个 限制 减少 了 需要 考 
虑 的 情况 。 

为 了 计算 结 点 的 代价 Cli], 我们 像 8.9 节 中 那样 把 指令 看 作 是 树 重 写 规则 。 考 虑 和 结 点 n 
处 的 输入 树 相 匹配 的 各 个 模板 E。 只 要 检查 n 的 相应 后 代 的 代价 向 量 , 就 可 以 确定 对 的 叶子 结 
点 所 代表 的 运算 分 量 进行 求 值 时 所 需要 的 代价 。 对 于 EE 的 寄存 器 运算 分 量 , 考虑 对 了 的 相应 子 
树 求 值 并 放 到 寄存 器 中 的 各 种 可 能 的 顺序 。 在 每 个 顺序 中 , 第 一 个 对 应 于 某 个 寄存 器 运算 分 量 
的 子 树 可 以 使 用 i 个 寄存 器 , 而 第 二 个 则 使 用 i-1 个 寄存 器, 以 此 类 推 。 考 虑 结 点 n 时 , 需要 加 
上 和 模板 相关 的 指令 的 代价 。C[ 站 的 值 就 是 所 有 这 些 可 能 的 顺序 所 对 应 的 代价 值 中 的 最 小 者 。 

整 棵 树 7 的 代价 向 量 可 以 用 自 底 向 上 的 方式 计算 。 计 算 所 需 时 间 和 了 中 结 点 的 个 数 呈 线性 
正比 关系 。 在 每 个 结 点 上 为 各 个 i 值 保存 用 于 获得 最 优 代价 C[ 直 所 使 用 的 指令 可 以 带 来 方便 。7 
的 根 结 点 的 代价 向 量 中 的 最 小 值 给 出 了 对 7 求 值 所 需 的 最 小 代价 。 
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E O 考 虑 有 两 个 寄存 器 RO. RL 及 下 列 的 指令 的 机 器 。 每 个 指令 的 代价 是 一 个 成 本 单位 : 
LD Ri, Mj // Ri = Mj 
op Ri, Ri, Rj // Ri = Ri op Rj 
op Ri, Ri, Mj // Ri = Ri op Mj 


LD Ri, Rj // Ri = Rj 

ST Mi, Rj // Mi = Rj 

在 这 些 指令 中 , Ri 可 以 是 RO MA RL, MM 则 是 一 个 内 存 位 置 。 运 算 符 op 对 应 于 某 个 算术 
运算 符 。 


让 我 们 应 用 动态 规划 算法 为 图 8-26 中 的 语法 树 生 成 最 优 的 代码 。 在 第 一 步 中 , 我 们 计算 每 
个 结 点 的 代价 向 量 。 这 些 向 量 在 图 中 各 个 结 点 的 旁边 显示 。 为 了 说 明代 价 计算 方法 , 考虑 在 叶 
子 结 点 a 处 的 代价 向 量 。C[01( 即 计算 a 并 保存 到 内 存 的 代价 ) 是 0, 因为 它 已 经 在 内 存 中 了 。 
CL1]( 即 计算 a 并 保存 到 一 个 寄存 器 的 代价 ) 是 1， 因为 我 们 可 以 使 用 指令 LD RO, a 把 它 加 载 到 
一 个 寄存 器 中 。C[2]( 即 在 有 两 个 可 用 寄存 器 的 情况 下 把 a 加 载 到 一 个 寄存 器 中 的 代价 ) 和 只 有 
一 个 可 用 寄存 器 的 情况 下 的 代价 是 一 样 的 。 因 此 , 在 叶子 结 点 a 上 的 代价 向 量 是 (0, 1, 1)。 





图 8-26 表达 式 (a -b) +c* (de) MIEN, 每 个 结 点 都 标 有 代价 向 量 














考虑 一 下 根 结 点 处 的 代价 向 量 。 我 们 首先 确定 在 有 一 个 及 两 个 可 用 寄存 器 的 情况 下 计算 根 
结 点 所 需 的 最 小 代价 。 因 为 根 结 点 的 标号 是 + ， 所 以 机 器 指令 ADD RO, RO, M 和 根 结 点 匹配 。 
使 用 这 个 指令 , 在 只 有 一 个 可 用 寄存 器 的 情况 下 对 根 结 点 求 值 的 最 小 代价 的 计算 方法 如 下 : 对 其 
右 子 树 求 值 并 存放 到 内 存 的 最 小 代价 , 加 上 计算 其 左 子 树 并 保存 到 寄存 器 的 最 小 代价 , 再 加 上 该 
指令 的 代价 1。 不 存在 其 他 的 最 小 代价 的 计算 方式 。 在 根 结 点 的 左右 子 结 点 上 的 代价 向 量 说 明 在 
只 有 一 个 可 用 寄存 器 的 情况 下 对 根 结 点 求 值 的 最 小 代价 是 5+2+1=8。 

现在 考虑 有 两 个 可 用 寄存 器 时 对 根 结 点 求 值 的 最 小 代价 。 根 据 用 于 计算 根 结 点 的 不 同 指令 ， 
以 及 对 根 结 点 的 左右 子 树 求 值 的 不 同 顺序 , 需要 考虑 三 种 情况 。 

1) 使 用 两 个 可 用 寄存 器 计算 左 子 树 的 值 并 放 到 寄存 器 RO 中 , 使 用 一 个 可 用 寄存 器 计算 右 
子 树 的 值 并 放 到 寄存 器 R1 中 , 并 使 用 指令 ADD RO, RO, RL 来 计算 根 结 点 。 这 个 指令 序列 的 代 
价 是 5+2+1 =8。 

2) 使 用 两 个 可 用 寄存 器 计算 右 子 树 的 值 并 存放 到 R1 中 , 使 用 一 个 可 用 寄存 器 计算 左 子 树 的 什 
并 存放 到 RO 中 , 并 使 用 指令 ADD RO, RO, RL 计算 根 结 点 。 这 个 指令 序列 的 代价 为 4+2+1=7。 

3) 计算 右 子 树 的 值 并 保存 到 内 存 位 置 M 中 , 使 用 两 个 可 用 寄存 器 计算 左 子 树 的 值 并 保存 到 
寄存 器 RO 中 ,并 使 用 指令 ADD R0，R0，M 计算 根 结 点 的 值 。 这 个 指令 序列 的 代价 是 
5+2+1=8。 

可 见 , 第 二 种 选择 给 出 了 最 小 的 代价 7。 ， 

计算 根 结 点 的 值 并 保存 到 内 存 中 的 代价 等 于 使 用 所 有 可 用 寄存 器 计算 根 结 点 的 值 的 最 小 代 
价 再 加 上 1。 也 就 是 说 , 我 们 首先 计算 根 结 点 并 将 其 存放 到 一 个 寄存 器 中 , 然后 保存 结果 。 因 
在 根 结 点 处 的 代价 向 量 是 (8, 8, 7) 。 
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根据 代价 向 量 , 我 们 可 以 很 容易 地 通过 对 树 的 遍历 构造 出 代码 序列 。 假 设 有 两 个 可 用 寄存 
器 , 图 8-26 的 树 的 最 优 代码 序列 是 : 


LD RO, c // RO= Cc 


LD Ri, a // Rl =d 

DIV R1, R1, e // Ri =RIi/e 

MUL RO, RO, R1 // RO = RO * Ri 

LD Ri, a // Rl =a 

SUB R1, Ri, b // Rt = Ri - b 

ADD Ri, Ri, RO // RA = RL + RO 口 


动态 规划 技术 已 经 在 很 多 编译 器 中 使 用 , 这 些 编译 器 包括 可 移植 C 编译 器 版 本 2, 即 PCC2 。 
因为 动态 规划 技术 可 以 用 到 很 多 类 型 的 机 器 上 ,这 个 技术 促进 了 编译 器 的 可 重 定向 特性 的 发 展 。 
8.11.3 8.11 节 的 练习 
| 练习 8. 11. 1: 在 图 8-20 中 的 树 重 写 方案 中 增加 代价 信息 ,并 用 动态 规划 和 树 匹 配 技术 来 为 
练习 8. 9. 1 中 的 语句 生成 代码 。 
1! 练习 8. 11.2: 你 将 如 何 扩 展 动态 规划 技术 , 以便 在 DAG 的 基础 上 生成 最 优 代码 ? 
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第 8 章 总 结 


代码 生成 是 编译 器 的 最 后 一 个 步 又。 代码 生成 器 把 前 端 生成 的 中 间 表 示 形 式 映 射 为 目标 
程序 。 如 果 存 在 一 个 代码 优化 阶段 , 那么 代码 生成 器 的 输入 就 是 代码 优化 器 生成 的 中 间 
表示 形式 。 

各 令 选 择 是 为 每 个 中 间 表 示 语 句 选择 目标 语言 指令 的 过 程 。 

寄存 器 分 配 是 决定 哪些 IR 值 将 会 保存 在 寄存 器 中 的 过 程 。 图 着 色 算法 是 一 个 在 编译 器 中 
完成 寄存 器 分 配 的 有 效 技术 。 

寄存 器 指派 是 决定 用 哪个 寄存 器 来 存放 一 个 给 定 的 IR 值 的 过 程 。 

可 重 定向 编译 器 是 能 够 为 多 个 指令 集 生 成 代码 的 编译 器 。 

虚拟 机 是 一 些 字 节 代码 中 间 语 言 的 解释 程序 , 这些 字 节 代码 是 为 诸如 Java 和 C# 这 样 的 语 
言 生成 。 

CISC 机 器 通常 是 一 个 二 地 赴 机 器 。 它 的 寄存 器 相对 较 少 , 有 几 种 寄存 器 类 型 ， 并 具有 复 
杂 寻 址 模式 的 可 变 长 指令 。 

RISC 机 器 通常 是 一 个 三 地 址 机 器 。 它 拥有 很 多 寡 存 器 ,， 且 运算 都 在 寄存 器 中 进行 。 
基本 块 是 一 个 三 地 址 语句 的 最 大 连续 序列 。 控 制 流 只 能 从 它 的 第 一 个 语句 进入 , 并 从 最 
后 一 个 语句 离开 , 中 间 没 有 停顿 , 且 除 了 基本 块 的 最 后 一 个 语句 之 外 没有 分 支 语句 。 

流 图 是 程序 的 一 种 图 形 化 表示 方式 。 其 中 图 的 结 点 是 基本 块 , 而 图 的 边 显 示 了 控制 流 如 
何在 基本 块 之 间 流 动 。 

流 图 中 的 循环 是 一 个 强 连 通 的 区 域 。 这 个 区 域 只 有 一 个 被 称 为 循环 首 结 点 的 人 口 。 

基本 块 的 DAG 表示 是 一 个 有 向 无 环 图 。DAG 中 的 结 点 表示 基本 块 中 的 语句 ,而 一 个 结 点 
的 各 个 子 结 点 所 对 应 的 语句 是 最 晚 对 该 结 点 对 应 语句 的 某 个 运算 分 量 进 行 定 值 的 语句 。 
宽 孔 优化 是 一 种 提高 代码 质量 的 局 部 变换 。 它 通常 通过 一 个 滑动 窗口 作用 于 一 个 程序 。 
指令 选择 可 以 通过 一 个 树 重 写 过 程 完成 。 在 这 个 过 程 中 , 对 应 于 机 器 指令 的 树 模式 被 用 
来 逐步 覆盖 一 棵 语法 树 。 我 们 可 以 把 树 重 写 规则 和 相应 的 指令 代价 关联 起 来 , 并 应 用 动 
态 规划 技术 来 为 多 种 类 型 的 机 器 和 表达 式 生成 最 优 的 覆盖 方式 。 

Ershov 数 指出 了 如 果 不 把 任何 临时 值 保存 回 内 存 中 , 对 一 个 表达 式 求 值 需要 多 少 个 寄 
存 器 。 
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o 溢出 代码 是 一 个 把 某 个 寄存 器 中 的 值 保存 到 内 存 中 的 指令 序列 。 这 些 指令 的 目的 是 在 寄 
存 器 中 腾 出 空间 ， 以 保存 另 一 个 值 。 


8.13 第 8 章 参考 文献 


本 章 中 讨论 的 很 多 技术 在 最 星 的 编译 器 中 就 出 现 了 。Ershov 的 加 标号 算法 出 现在 1958 年 
[7]. Sethi 和 Ullman[ 16] 在 一 个 算法 中 使 用 了 这 种 标号 方法 。 他 们 还 证 明了 这 种 算法 可 以 为 算 
术 表 达 式 生成 最 优 代码 。Aho 和 Johnson[ 1] 使 用 动态 规划 技术 来 为 CISC 机 器 上 的 表达 式 树 生成 
最 优 代 码 。Hennessy 和 Patterson[ 12] 对 CISC 和 RISC 机 器 体系 结构 的 发 展 , 以 及 在 设计 一 个 好 的 
省 令 集 时 需要 做 出 的 权衡 进行 了 很 好 的 讨论 。 

虽然 RISC 的 历史 可 以 追溯 到 更 早 的 计算 机 中 ,比如 最 先 在 1964 年 交付 的 CDC6600, 但 RISC 
体系 结构 在 1990 年 之 后 才 流行 起 来 。 在 1990 年 之 前 设计 的 很 多 计算 机 都 是 CISC 机 器 , 然而 大 
多 数 在 1990 年 之 后 安装 的 通用 计算 机 仍然 是 CSC 机 器 ,因为 它们 都 基于 Intel 80x86 或 其 后 代 
(比如 Pentium 芯片 ) 的 体系 结构 。 在 1963 年 交付 的 Burroughs B5000 是 一 个 早期 的 栈 计 算 机 。 

本 章 中 给 出 的 很 多 关于 代码 生成 的 启发 式 规 则 已 经 被 用 到 不 同 的 编译 嚣 中。 我们 描述 了 在 
循环 执行 时 用 固定 数量 寄存 器 存放 变量 的 策略 。 这 个 策略 被 Lowry 和 Medlock 用 在 Fortran H 的 
实现 中 [13] 。 

高 效 的 寄存 器 分 配 技术 在 编译 器 出 现 的 最 早 时 代 就 开始 研究 了 。 把 图 着 色 算 法 作为 一 种 寄 
存 器 分 配 技术 是 由 Cocke 、Ershov[8] 和 Sechwartz[ 15 ] 提 出 的 。 针 对 寄存 器 分 配 ， 人 们 提出 了 很 多 
种 图 着 色 算法 的 变 体 。 我 们 处 理 图 着 色 的 方法 来 自 于 Chaitin[3][4] 。Chow 和 Hennessy 在 [5] 中 
描述 了 他 们 的 可 用 于 寄存 器 分 配 的 基于 优先 级 的 着 色 算法 。 在 [6] 中 可 以 匈 到 针对 最 新 的 用 于 寄 
存 器 分 配 的 图 分 划 和 重 写 技术 的 讨论 。 

词法 分 析 器 和 语法 分 析 器 的 自动 生成 工具 刺激 了 模式 制导 的 指令 选择 技术 的 发 展 。Glanville 
和 Graham[11] 使 用 LR 语法 分 析 器 生成 技术 来 处 理 指 令 的 自动 选择 。 表 格 驱 动 的 代码 生成 器 发 
展 成 为 多 个 基于 树 模式 匹配 的 代码 生成 工具 [14]。 在 代码 生成 工具 twig 中 , Aho, Ganapathi 和 
Tjiang[2] 把 高 效 的 树 模 式 匹 配 技 术 和 动态 规划 技术 结合 起 来 。Fraser、Hanson 和 Proebsting[ 10] 
在 他 们 的 简单 有 效 的 代码 生成 器 的 生成 器 中 进一步 精 化 了 这 些 思 想 。 


1. Aho, A. V. and S. C. Johnson, “Optimal code generation for expression 
trees,” J. ACM 23:3, pp. 488-501. 


2. Aho, A. V., M. Ganapathi, and S. W. K. Tjiang, “Code generation using 
tree matching and dynamic programming,” ACM Trans. Programming 
Languages and Systems 11:4 (1989), pp. 491-516. 


3. Chaitin, G. J., M. A. Auslander, A. K. Chandra, J. Cocke, M. E. Hop- 
kins, and P. W. Markstein, “Register allocation via coloring,” Computer 
Languages 6:1 (1981), pp. 47-57. 


4. Chaitin, G. J., “Register allocation and spilling via graph coloring,” ACM 
SIGPLAN Notices 17:6 (1982), pp. 201-207. 


5. Chow, F. and J. L. Hennessy, “The priority-based coloring approach to 
register allocation,” ACM Trans. Programming Languages and Systems 
12:4 (1990), pp. 501-536. 








代码 生成 


一 一 - 





~I 


10. 


11. 


12. 


13. 


14. 


15. 


16. 


. Cooper, K. D. and L. Torczon, Engineering a Compiler, Morgan Kauf- 


mann, San Francisco CA, 2004. 


. Ershov, A. P., “On programming of arithmetic operations,” Comm. ACM 


1:8 (1958), pp. 3-6. Also, Comm. ACM 1:9 (1958), p. 16. 


. Ershov, A. P., The Alpha Automatic Programming System, Academic 


Press, New York, 1971. 


. Fischer, C. N. and R. J. LeBlanc, Crafting a Compiler with C, Benjamin- 


Cummings, Redwood City, CA, 1991. 


Fraser, C. W., D. R. Hanson, and T. A. Proebsting, “Engineering a sim- 
ple, efficient code generator generator,” ACM Letters on Programming 
Languages and Systems 1:3 (1992), pp. 213-226. 


Glanville, R. S. and S. L. Graham, “A new method for compiler code gen- 
eration,” Conf. Rec. Fifth ACM Symposium on Principles of Programming 
Languages (1978), pp. 231--240. 


Hennessy, J. L. and D. A. Patterson, Computer Architecture: A Quanti- 
tative Approach, Third Edition, Morgan Kaufman, San Francisco, 2003. 


Lowry, E. S. and C. W. Medlock, “Object code optimization,” Comm. 
ACM 12:1 (1969), pp. 13-22. 


Pelegri-Llopart, E. and S. L. Graham, “Optimal code generation for ex- 
pressions treeś: an application of BURS theory,” Conf. Rec. Fifteenth An- 
nual ACM Symposium on Principles of Programming Languages (1988), 
pp. 294-308. 


Schwartz, J. T., On Programming: An Interim Report on the SETL 
Project, Technical Report, Courant Institute of Mathematical Sciences, 
New York, 1973. 


Sethi, R. and J. D. Ullman, “The generation of optimal code for arithmetic 
expressions,” J. ACM 17:4 (1970), pp. 715-728. 


第 9 章 机 器 无 关 优 化 


如 果 我 们 简单 地 把 每 个 高 级 语言 结构 独立 地 翻译 成 为 机 器 代码 , 那么 会 带 来 相当 大 的 运行 时 刻 
的 开销 。 本 章 讨 论 如 何 消 除 这 样 的 低 效率 因素 。 在 目标 代码 中 消除 不 必要 的 指令 , 或 者 把 一 个 指令 
序列 蔡 换 为 一 个 完成 同样 功能 的 较 快 的 指令 序列 , 通常 被 称 为 “代码 改进 "或 者 “代码 优化 ”。 

局 部 代码 优化 (在 一 个 基本 块 内 改进 代码 ) 的 相关 知识 已 经 在 8.5 节 介绍 过 了 。 本 章 将 处 理 
全 局 代码 优化 问题 。 在 全 局 优化 中 , 代码 的 改进 将 考虑 在 多 个 基本 块 内 发 生 的 事情 。 我 们 将 在 
9.1 节 中 讨论 一 些 主要 的 代码 改进 机 会 。 

大 部 分 全 局 优化 是 基于 数据 流 分 析 (data-flow analyse) 技术 实现 的 。 数 据 流 分 析 技 术 是 一 组 
用 以 收集 程序 相关 信息 的 算法 。 所 有 数据 流 分 析 的 结果 都 具有 相同 的 形式 : 对 于 程序 中 的 每 个 
指令 , 它们 描述 了 该 指令 每 次 执行 时 必然 成 立 的 一 些 性 质 。 不 同性 质 的 分 析 方 法 各 不 相同 。 比 
如 , 对 于 常量 传播 分 析 而 言 , 要 判断 在 程序 的 每 个 点 上 , 程序 使 用 的 各 个 变量 是 否 在 该 点 上 具有 
唯一 的 常量 值 。 比 如 , 这 个 信息 可 以 用 于 把 变量 引用 替换 为 常量 值 。 男 一 个 例子 是 , REDO 
确定 在 程序 的 每 个 点 上 , 在 某 个 变量 中 存放 的 值 是 否 一 定 会 在 被 读 取 之 前 被 覆盖 掉 。 如 果 是 , 我 
们 就 不 需要 在 寄存 器 或 内 存 位 置 上 保留 这 个 值 。 

我 们 将 在 9. 2 节 介 绍 数据 流 分 析 技术 。 其 中 还 包括 几 个 重要 的 例子 , 说 明 我 们 如 何 使 用 在 全 
局 范围 内 收集 到 的 信息 来 改进 代码 。9. 3 节 将 介绍 一 个 数据 流 框架 的 总 体 思想 , 9. 2 节 中 的 数据 
流 分 析 技 术 是 这 个 框架 的 特例 。 我 们 实际 上 可 以 使 用 同一 个 算法 来 解决 这 些 数 据 流 分 析 的 实例 。 
我 们 还 能 够 度量 这 些 算法 的 性 能 , 并 且 证 明 它 们 对 所 有 分 析 技术 的 实 钢 而 言 都 是 正确 的 。9.4 节 
是 总 体 框架 的 一 个 例子 , 它 的 分 析 功 能 比 前 面 的 例子 更 强大 。 然 后 , 我 们 将 在 9.5 节 中 考虑 一 个 
被 称 为 “部 分 元 余 消 除 ” 的 功能 强大 的 技术 。 这 个 技术 可 用 于 优化 程序 中 各 个 表达 式 求 值 的 位 置 。 
这 个 问题 的 解决 方案 由 不 同 的 数据 流 分 析 问 题 的 解决 方案 通过 组 合 而 得 到 。 

在 9.6 节 , 我 们 将 讨论 程序 中 循环 的 发 现 和 分 析 。 对 循环 的 识别 引出 了 另 一 个 用 来 解决 数据 
流 问题 的 算法 族 。 这 些 算法 基于 一 个 结构 良好 的 ( 即 可 归 约 的 ) 程 序 中 的 循环 的 层次 结构 。 这 个 
处 理 数 据 流 分 析 的 方法 将 在 9.7 节 中 讨论 。 最 后 , 在 9.8 节 中 将 使 用 层次 化 分 析 来 消除 归纳 变量 
(归纳 变量 本 质 上 就 是 用 来 对 循环 的 迭代 次 数 进行 计数 的 变量 ) 。 这 种 代码 改进 是 我 们 能 够 对 那 
些 由 常用 程序 设计 语言 书写 的 程序 所 做 的 最 重要 的 改进 之 一 。 


9.1 优化 的 主要 来 源 


编译 器 的 优化 必须 保持 源 程序 的 语义 。 除 了 一 些 非常 特殊 的 场合 之 外 ,， 一旦 程序 员 选 择 并 
实现 了 某 种 算法 ， 编 译 器 不 可 能 完全 理解 这 个 程序 并 把 它 替 换 为 一 个 全 然 不 同 且 更 加 高 效 的 等 
价 算法 。 编 译 器 只 知道 如 何 应 用 一 些 相对 低层 的 语义 转换 。 在 进行 转换 时 ,编译 器 用 到 一 些 党 
见 的 性 质 ， 比 如 像 i+0 =i 这 样 的 代数 恒等式 或 使 用 一 些 程序 语义 (如 在 同样 的 值 上 进行 同样 的 
运算 必然 得 到 同样 的 结果 ) 。 

9.1.1 宛 余 的 原因 

在 一 个 典型 的 程序 中 会 存在 很 多 元 余 的 运算 。 有 了 时， 在 源 代码 中 会 用 到 元 余 。 比 如 ,程序 员 
可 能 发 现 重 新 计算 某 些 结果 会 更 为 直接 和 方便 ， 而 让 编译 器 去 发 现实 际 上 只 需要 进行 一 次 这 样 
的 计算 。 但 更 多 的 时 候 , 宛 余 性 是 使 用 高 级 程序 设计 语言 编程 的 副产品 。 在 大 部 分 程序 设计 语 
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言 (不 包含 C 或 者 C++ ,它们 允许 对 指针 进行 算术 运算 ) 中 ,程序 员 别 无 选择 ,只 能 使 用 类 似 于 
ALE] (ADR of 1 的 方式 来 访问 一 个 数组 的 元 素 或 一 个 结构 的 字段 。 

当 一 个 程序 被 编译 后 ,每 一 个 这 样 的 高 层 数据 结构 访问 都 会 被 扩展 成 为 多 个 低层 次 的 算术 
运算 ， 比 如 计算 一 个 矩阵 4 的 第 (i ) 个 元 素 的 位 置 的 运算 。 对 同一 个 数据 结构 的 访问 通常 共享 
了 很 多 公共 的 低层 运算 。 程 序 员 不 知道 这 些 低层 运算 ,因此 不 能 自己 去 消除 这 些 匈 余 。 实 际 上 ， 
从 软件 工程 的 角度 看 ,程序 员 只 通过 数据 元 素 的 高 层 名 字 来 访问 它们 是 比较 好 的 做 法 。 这 样 ， 程 
序 容易 书写 , 并 且 和 更 重要 的 是 , 程序 更 容易 理解 和 演化 。 通 过 让 -个 编译 器 来 消除 这 些 宛 余 , 我 
们 在 两 个 方面 都 得 到 了 最 好 的 结果 : 程序 不 仅 高 效 而 且 易于 维护 。 

”9. 1.2 一 个 贯穿 本 章 的 例子 :快速 排序 

接 下 来 ,我们 将 使 用 被 称 为 快速 排序 ( quicksort) 的 排序 程序 的 片断 来 说 明 几 个 重要 的 可 以 改 
进 代 码 的 转换 。 在 图 9-1 中 的 C 程序 是 从 Sedgewick@ 那 里 拿 来 的 它 讨论 了 如 何 对 这 样 一 个 程序 
进行 手工 优化 。 我 们 将 不 会 在 这 里 讨论 这 个 程序 在 算法 方面 的 所 有 精妙 细节 ， 比 如 ，af 0 ] 必然 
存放 着 已 经 排 好 序 的 元 素 的 最 小 者 ,而 a[ max] 则 存放 最 大 的 元 素 。 





void quicksort(int m, int n) 
/* 递归 地 对 ar 由 和 afo] 之 闻 的 元 素 排序 */ 
{ 
int i, j; 
int v, x; 
if (n <= m) return; 
/* 片断 由 此 开始 */ 
i=m-1; j = n; v = aln]; 
while (1) { 
do i = i+1; while (a[i] < v); 
do j = j-1; while (a[j] > v); 
if (i >= j) break; 
x = ali]; ali] = a[j]; alj] = x; /* 对 换 a[i] 和 a[j]*/ 
} 
x = ali]; a[i] = a[n]; aln] = x; /* 对 换 a[i] 和 a[n] */ 
/x* 片断 在 此 结束 */ 


quicksort(m,j); quicksort(iti,n); 








图 9-1 快速 排序 算法 的 C 代码 


在 我 们 可 以 优化 掉 地 址 计算 中 的 元 余 之 前 , 程序 中 的 地 址 运算 首先 必须 被 分 解 成 为 低层 次 
的 算术 运算 ,这 样 才能 暴露 出 宛 余 之 处 。 在 本 章 的 其 余部 分 , 我 们 假设 中 间 表 示 形 式 由 三 地 址 语 
名 组 成 , 其 中 所 有 的 中 间 表 达 式 的 结果 都 由 临时 变量 来 存放 。 在 图 9-1 中 标记 出 的 程序 片断 的 中 
间 代 码 显 示 在 图 9-2 中 。 

在 这 个 例子 中 , 我 们 假设 整数 占用 4 个 字 节 。 赋 值 运 算 x =a[ i] 按 照 6.4.4 节 中 的 方法 被 
翻译 成 为 图 9-22 中 (14)、(15) 步 所 示 的 两 个 三 地 址 语句 ， 即 


t6 = 4*i 
x = a[t6] 
类 似 地 ，a[j] =x 变 成 了 第 (20) 和 (21) 步 ， 即 
t10 = 4*j 
a[tl0] = x 


请 注意 , 在 原 程序 中 的 每 个 数组 访问 都 被 翻译 成 为 一 对 语句 ,其 中 包含 一 个 乘法 和 一 个 数组 下 标 





© R. Sedgewick, “Implementing Quicksort Programs” , Comm. ACM, 21, 1978, pp. 847-857. 
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运算 。 结 果 , 这 个 短 短 的 程序 片断 被 翻译 成 为 一 个 相当 长 的 三 地 址 运算 序列 。 





(1) i = m-1 (16) t7 = 4*i 

(2) jan (17) t8 = 4*j 

(3) ti = 4*n (18) t9 = a[t8] 
(4) v = alti] (19) a[t7] = t9 
(5) i = itt (20) t10 = 4x3 
(6) t2 = 4*i (21) a[t10] = x 
(7) t3 = alt2] (22) goto (5) 

(8) if t3<v goto (5) (23) til = 4*i 
(9) j= j-i (24) x = altii] 
(10) t4 = 4*j (25) t12 = 4*i 
(11) t5 = aft4] (26) t13 = 4*n 
(12) if t5>v goto (9) (27) t14 = a[t13] 
(13) if i>=j goto (23) (28) alt12] = t14 
(14) t6 = 4*i (29) t15 = 4*n 
(15) x = aft6] (30) aftl5] = x 











9-2 图 9-1 中 程序 片断 的 三 地 址 代码 





图 9-3 是 图 9-2 中 的 程序 的 流 图 。 基 本 块 B 是 其 人 口 结 点 。8.4 节 介 绍 过 , 图 9-2 中 所 有 的 
条 件 和 无 条 件 跳 转 语句 的 目标 在 图 9-3 中 都 被 蓉 换 为 以 它们 的 目标 语句 为 首 语句 的 基本 块 。 在 
图 9-3 中 有 三 个 循环 。 基 本 块 B, AB; 本 身 就 是 循环 。 基 本 块 B,. By. By. Bs 一 起 组 成 了 一 个 
循环 , 其 中 Bs 是 唯一 的 人 口 结 点 。 








全 = m-1 By 
l5 =n 
ltl = 4*n 
v = a(tlj | 
ey 
pa i itl B, 








j = 4-1 B, 
t4 = 4*j 
t5 = a[t4] 


if t5>v goto B, 


aes 


if i>=j gotoB, | B} 


























a[t1l0] = x 
\ 


图 9-3 快速 排序 代码 片断 的 流 图 
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9.1.3 保持 语义 不 变 的 转换 
编译 器 可 以 使 用 很 多 种 方法 改进 一 个 程序 , 但 不 改变 程序 所 计算 的 函数 。 公 共 子 表达 式 消 除 、 
复制 传播 、 死 代码 消除 和 常量 折 盖 都 是 这 样 的 沙 数 不 变 ( 或 者 说 语义 不 ”一 一 一 一 
变 ) 转 换 的 常见 例子 。 我 们 将 逐一 介绍 这 些 方法 。 x = alt6] 
一 个 程序 中 经 常 包 含 对 同一 个 值 的 多 次 计算 ,比如 计算 数组 中 的 偏 ”| ts 
移 量 。9. 1.2 节 提 到 过 , 某 些 这 样 的 重复 计算 不 可 能 由 程序 员 来 避免 , 因 | ae EEG 
为 这 些 计算 过 程 处 于 可 在 源 语 言 中 处 理 的 细节 的 更 下 层 。 比 如 , 在 图 9- | +10 = 4*j 





a[t10] = x 
4a 中 显示 的 基本 块 B; 中 对 4 *i 和 4*j 进 行 了 重复 计算 , 尽管 这 些 计算 ”| goto B, 
全 都 不 是 程序 员 显 式 要求 的 。 a) 消除 之 前 
9.1.4 全 局 公共 子 表达 式 t6 = 4*i Bs 


如 果 表 达 式 巨 在 某 次 出 现 之 前 已 经 被 计算 过 ,并 且 已 中 变量 的 值 从 | te =a 
那 次 计算 之 后 就 一 直 没 被 改变 , 那么 的 该 次 出 现 就 称 为 一 个 公共 子 表 kao u 
达 式 (common subexpression)。 如 果 将 的 上 一 次 计算 结果 赋予 变量 x, a[t8] = x 
Bx 的 值 在 中 间 没 有 被 改变 , 那么 我 们 就 可 以 使 用 前 面 计 算得 到 的 值 ， 一 一 一 一 
从 而 避免 重新 计算 E。 . b) 消除 之 后 
GR 在 图 9-4a 中 对 t7 和 t+10 的 赋值 分 别 计算 了 公共 子 表 达 式 ”图 9-4 局 部 公共 了 于 
4 #i 和 4*j。 这些 步 又 已 经 在 图 9-4b 中 被 消除 了 。 消 除 后 的 代码 使 用 | SOBER 
t6 KS t7, 使 用 t8 HE t10。 

图 9-5 显示 了 从 图 9-3 中 流 图 的 基本 块 B; 和 B6 中 消除 全 局 和 局 部 公共 子 表达 式 之 后 
的 结果 。 我 们 首先 讨论 对 Bs 的 转换 ， 然 后 再 讨论 一 些 和 数组 相关 的 精妙 之 处 。 

如 图 9-4b 所 示 , 在 消除 局 部 公共 子 表达 式 之 后 ，B5 仍然 对 4 i 和 4 * 进行 求 值 。 它 们 都 是 
公共 子 表达 式 。 更 明确 地 讲 ， 使 用 在 By 中 计算 得 到 的 4 的 值 ，Bs 中 的 三 个 语句 

t8 = 4*j 


t9 = a[t8] 
a[t8] =x 


可 以 替换 为 
t9 = a[t4] 
a[t4] = x 


观察 一 下 图 9-5, 我 们 会 发 现 当 控制 流 从 Bs 中 计算 4 *7 的 点 传递 到 B, 中 时 ,7 和 区 的 值 都 没有 
改变 。 因 此 ， 当 需要 4 *7 时 可 以 使 用 考 来 薪 代 。 

在 用 i4 ER 18 SIR, Bs 中 的 另 一 个 公共 子 表达 式 就 显露 出 来 了 。 新 的 子 表达 式 是 altt], 
对 应 于 源 代码 层次 上 的 值 a[j] 。 当 控制 流离 开 By 进入 Bs 时 , 不 仅仅 j 保 留 了 它 的 值 , alj] tA 
留 了 原来 的 值 。 这 个 值 在 计算 出 来 之 后 保存 到 临时 变量 5 中 。 因 为 中 间 没 有 对 数组 a 中 元 素 的 
赋值 , 内 此 a[ 站 的 值 不 变 。B; 中 的 语句 


t9 = a[t4] 
a[t6] = t9 


可 以 被 蔡 换 为 
a[t6] = t5 


类 似 地 , 可 以 看 出 图 9-4b 的 基本 块 Bs FIRZA x 的 值 和 By 中 赋 给 w3 的 值 相同 。 图 9-5 中 的 


























”即使 x 被 改变 , 如果 我 们 把 E 的 计算 结果 同时 赋值 给 变量 x 各 另 一 个 新 的 变量 y, 我 们 仍然 可 以 用 y 来 替代 对 5 
的 计算 , 从 而 复 用 该 计算 过 程 。 
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Bs 是 从 图 9-4b 的 Bs 中 消除 了 与 源 代 码 级 表达 式 cli] Mel AWMMHAKFRARZS WA 
果 。 对 于 图 9-5 中 的 By 也 进行 了 一 系列 类 似 的 转换 。 

图 9- 的 B Al Be 中 的 表达 式 ae[ 红 ] 不 被 认为 是 公共 子 表 达 式 ， 虽 然 在 这 两 个 地 方 都 可 以 使 
用 红 。 在 控制 流离 开 B, 到 达 B6 之 前 , 它 还 可 能 经 过 Bs , 而 85 中 存在 对 a 的 赋值 。 因 此 , a[11] 
到 达 Be 时 的 值 可 能 和 它 离开 By 时 的 值 有 所 不 同 。 把 a[ 11] 作 为 一 个 公共 子 表达 式 是 不 安全 的 。 











口 
i= m-1 By 
jamn 
tl = 4*n 
v = a(tl] 
ae 
i = itl B 


t2 = 4*i 


t3 = a[t2] 
Se if t3<v gotoB, 





j = 5-1 B, 
tå = 4*j 
t5 = a(t4} 


if t5>v gotoB 3 


| 





if i>=j goto By B 












x= t3 
a[t2] = t5 
a{t4) = x 
goto B, 











. 图 9-5 ”经 过 公共 子 表达 式 消除 之 后 的 B, 和 B 
9. 1.5 复制 传播 

图 9-5 中 的 基本 块 Bs 可 以 通过 使 用 两 个 新 转换 来 消除 *, 从 而 得 到 进一步 改进 。 其 中 的 一 个 
转换 考虑 形 如 u =v 的 赋值 表达 式 , 这 种 表达 式 被 称 为 复制 语句 (copy Ta- arel [b = arel 





statement) ， 或 者 简称 复制 。 只 要 我 们 更 加 细致 地 考虑 例 9.2, 很 快 就 





会 发 现 一 些 复制 语句 。 因 为 常用 的 公共 子 表 达 式 消除 算法 会 引入 这 些 = 
复制 语句 ,其 他 一 些 优化 算法 也 会 引入 这 样 的 语句 。 





DEE 为 了 消除 四 9-64 中 的 公共 了 表达 式 语句 c =a +e, 我 们 必 | 区 | [eres 











须 使 用 新 的 变量 ; 来 存放 4 + e 的 值 。 在 图 9-6h 中 , 赋 给 变量 c 的 是 变 NO 7i 
量 ! 的 值 ,而 不 是 表达 式 4+ e 的 值 。 因 为 控制 流 可 能 经 过 对 a ERLE [et 

到 达 语句 c = b + e 处 ， 也 可 能 经 过 对 的 赋值 到 达 这 里 , 因此 把 c = b) 

d +e SRA c =a 或 c =b 都 是 不 正确 的 。 g 图 9-6 在 公共 子 





隐藏 在 复制 传播 转换 之 后 的 基本 思想 是 在 复制 语句 u = v 之 后 尽 。” ”表达 式 消除 过 程 中 
可 能 地 用 ”来 蔡 代 u。 比 如 , 图 9-5 的 基本 块 B, 中 的 赋值 语句 x =t3 引入 的 复制 语句 
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是 一 个 复制 语句 。 把 复制 传播 应 用 于 Bs 会 生成 图 9-7 中 的 代码 。 这 个 改变 看 起 来 可 能 不 像 是 _ 
个 改进 , (LE, 正如 我 们 将 在 9. 1. 6 节 看 到 的 ， 它 给 了 我 们 消除 对 x 赋值 的 [一 二 
:语句 的 机 会 。 alt2] = t5 
a[t4] = t3 

9.1.6 死 代 码 消除 goto By 

如 果 一 个 变量 在 某 一 程序 点 上 的 值 可 能 会 在 以 后 被 使 用 , 那么 我 们 就 
说 这 个 变量 在 该 点 上 活跃 (live) 。 否 则 ， 它 在 该 点 上 就 是 死 的 (dead) 。 与 ”图 ?7 进行 复制 
此 相关 的 一 个 想法 就 是 死 (或 者 说 无 用 ) 代码 。 所 谓 死 代码 就 是 其 计算 结果 baile Hg 
永远 不 会 被 使 用 的 语句 。 程 序 员 不 大 可 能 有 意 引 入 死 代码 , 死 代码 多 半 是 。 EPs 
因为 前 面 执行 过 的 某 些 转换 而 造成 的 。 
假设 变量 debug 在 程序 的 不 同 点 上 被 设置 为 TRUE 或 者 FALSE, 并 在 如 下 的 语句 中 
使 用 : 

if (debug) print ... 

编译 器 可 能 能 够 推导 出 这 样 的 结果 : 每 次 程序 运行 到 这 个 语句 时 ，aebug 的 值 都 是 FALSE, 
通常 ,出 现 这 种 情况 的 原因 是 不 管 程序 实际 上 沿 着 什么 分 支 运行 , 在 测试 debug 的 取 值 之 前 的 
最 后 一 个 对 debug 赋值 的 语句 总 是 : 


debug = FALSE 
如 果 复 制 传播 把 debug HAH FALSE, 那么 因为 print 语句 不 可 能 被 运行 到 , 所 以 它 就 成 为 死 
代码 。 我 们 可 以 把 这 个 测试 和 print 语句 从 目标 代码 中 全 部 消除 。 更 加 一 般 地 讲 ， 如 果 在 编译 时 
刻 推 导出 一 个 表达 式 的 值 是 常量 ,就 可 以 使 用 该 常量 来 蔡 代 这 个 表达 式 。 这 个 技术 被 称 为 常量 
af Bo O 

复制 传播 的 好 处 之 一 就 是 它 经 常 把 一 些 复 制 语 句 变 成 死 代 码 。 比 如 ,先进 行 复制 传播 再 进 
行 死 代码 消除 就 可 以 去 掉 图 9-7 的 代码 中 对 x 的 赋值 , 并 将 其 转换 成 为 

a[t2] = t5 


a[t4] = t3 
goto By 


这 个 代码 是 对 图 9-5 中 的 基本 块 B; 的 进一步 改进 。 
9.1.7 代码 移动 

对 于 优化 工作 而 言 , 循环 (尤其 内 部 循环 ) 是 一 个 重要 的 地 方 。 因 为 程序 往往 会 将 它们 的 大 
部 分 运行 时 间 花 费 在 循环 上 。 如 果 我 们 减少 一 个 内 部 循环 中 的 指令 个 数 ,， 即 使 因此 增加 了 该 循 
环 外 的 代码 , 程序 的 运行 时 间 也 可 以 减少 。 

减少 循环 内 部 代码 数量 的 一 个 重要 改动 是 代码 移动 (code motion) 。 这 个 转换 处 理 的 是 那些 
不 管 循环 执行 多 少 次 都 得 到 相同 结果 的 表达 式 ( 即 循环 不 变 计 算 ), 在 进入 循环 之 前 就 对 它们 求 
值 。 请 注意 ,“ 在 循环 之 前 ”的 说 法 假设 了 存在 一 个 循环 人 口 。 所 谓 循 环 人 口 就 是 一 个 基本 块 ， 
所 有 循环 外 部 到 循环 的 跳 转 指令 都 以 它 为 目标 ( 见 8.4.5 节 )。 
ALLS 在 下 面 的 while 语句 中 , 对 limit -2 的 求 值 是 一 个 循环 不 变 计算 : 

while (i <= limit-2) /x* 不 改变 limit 值 的 语句 */ 


进行 代码 移动 之 后 将 得 到 如 下 的 等 价 代 码 : 
t = limit-2 
while Gi <= t) /* 不 改变 1imit 或 t 值 的 语句 */ 


现在 , limit -2 的 计算 只 在 进入 循环 之 前 被 执行 一 次 。 之 前 , 如 果 我 们 重复 循环 体 n 次, 就 
会 对 limit -2 计算 ntl 次 。 B| 
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9.1.8 ”归纳 变量 和 强度 消减 

另 一 个 重要 的 优化 是 在 循环 中 找到 归纳 变量 并 优化 它们 的 计算 。 对 于 一 个 变量 4, 如果 存在 
一 个 正 的 或 负 的 常数 。 使 得 每 次 x 被 赋值 时 它 的 值 总 是 增加 , 那么 x 就 称 为 “归纳 变量 "。 比 如 ， 
在 图 9-5 中 , i 和 /2 都 是 By 组 成 的 循环 中 的 归纳 变量 。 归 纳 变量 可 以 通过 每 次 迭代 进行 一 次 简 
单 的 增 量 运算 (加 法 或 减法 ) 来 计算 。 把 一 个 高 代价 的 运算 ( 比如 乘法 ) 替换 为 一 个 代价 较 低 的 运 
算 ( 比如 加 法 ) 的 转换 被 称 为 强度 消减 (strength reduction) 。 但 是 归纳 变量 不 仅 允 许 我 们 在 适当 的 
时 候 进行 强度 消减 优化 ; 在 我 们 沿 着 循环 运行 时 ,如 果 有 一 组 归纳 变量 的 什 的 变化 保持 步调 一 
致 ,我 们 常常 可 以 将 这 组 变量 删 剩 一 个 。 

在 处 理 循环 时 ,按照 “从 里 到 外 ”的 方式 进行 工作 是 很 有 用 的 。 也 就 是 说 , 我 们 应 该 从 内 部 循环 开 
始 , 然后 逐步 处 理 较 大 的 外 半 循 环 。 这 样 , 我 们 将 看 到 这 个 优化 是 如 何 从 最 内 层 的 循环 之 一 ( 即 Bs ) 开 
始 被 应 用 到 我 们 的 快速 排序 例子 中 的 。 请 注意 , j 和 44 的 值 的 步调 保持 一 致 ; 因为 4 *j 被 赋 给 A, 每 次 
j 的 值 减少 1 时 14 的 值 就 减少 4。 变 量 j 和 4 就 形成 了 一 个 很 好 的 归纳 变量 对 的 例子 。 

当 一 个 循环 中 存在 两 个 或 更 多 的 归纳 变量 时 ， 有 可 能 只 留 下 一 个 而 删除 其 他 的 变量 。 对 于 
图 9-5 中 的 内 层 循环 Ba, 我 们 不 能 把 j 或 4 完全 删除 。4 EB, 中 使 用 , 而 j 在 B 中 使 用 。 但 是 ， 
我 们 可 以 用 这 个 例子 来 说 明 强度 消减 优化 以 及 归纳 变量 消除 的 部 分 过 程 。 当 考虑 由 By. By. By 
Bs 组 成 的 外 层 循环 时 , j 最 终 会 被 消除 。 
RRS) Hos 中 ,关系 4=4*j Het A 赋值 之 后 一定 成 立 , 并 且 BAERE B 中 的 其 
他 地 方 被 改变 , 这 意味 着 关系 4 =4 *j +4 在 紧 跟 语 句 j =j -1 之 后 必然 成 立 。 因 此 我 们 可 以 用 14 = 
4 -4 来 替代 赋值 语句 14 =4 *j。 唯 一 的 问题 是 在 我 们 第 一 次 进入 基本 块 B 时 ,14 还 没有 值 。 

因为 我 们 必须 在 进入 基本 块 By 的 时 候 保证 关系 4 =4 *j 成 立 , 所 以 在 初始 化 j 本 身 的 基本 块 
的 尾部 放置 了 一 个 对 (4 的 初始 化 语句 。 这 个 语句 在 图 9-8 中 以 附加 在 基本 块 B 上 的 虚线 框 表示 。 








Re if t3<v gotoB, 
T 









Je jal B 3 
t4 = t4-4 
t5 = a[t4] 


if t5>v goto B, 


| 


if i>=j goto Be B 


pa t3 B; i = t3 sal Be 
a[t2} = t5 t14 = a[tl] 
a[t4) =x a[t2} = 七 14 




















a aes 


图 9-8 对 基本 块 B, 中 的 4*j 应 用 强度 消减 优化 





机 器 无 关 优化 38) 





虽然 我 们 增加 了 一 个 指令 , 但 是 它 只 会 在 基本 块 Bi 中 执行 一 次 。 只 要 乘法 运算 比 加 法 或 者 减法 
需要 更 多 的 时 间 , 那么 把 一 个 乘法 运算 替换 为 减法 运 算 就 能 加 快 目标 代码 的 执行 速度 而 这 个 
结论 在 很 多 机 器 上 都 成 立 。 口 
我 们 用 另 一 个 归纳 变量 消除 的 例子 来 结束 本 节 。 在 这 个 例子 中 , 我 们 将 在 包含 了 By. By, Ba 
和 Bs 的 外 层 循环 中 处 理 i 和 j。 
在 强度 消减 优化 被 应 用 到 分 别 环绕 By. By 的 两 个 内 部 循环 之 后 , i 和 j 的 唯一 用 途 是 
计算 基本 块 B4 中 的 测试 的 结果 。 我 们 知道 了 和 如 的 值 满足 关系 避 =4x*i, MA A EN E 
系 引 =4* 六 因此 , 测试 ?> 可 以 被 替换 为 224, AAN, B, 中 的 i 和 Bs 中 的 了 就 
变 成 了 死 变量 ， 而 在 这 些 基本 块 中 对 它们 的 赋值 就 变 成 了 可 以 删除 的 死 代 码 。 最 后 得 到 的 流 网 
如 图 9-9 所 示 。 口 











t2 = t2+4 B, 
t3 = alt2] 
if t3<v goto By 


t4 = t4-4 B 
t5 = a[t4] 
if t5>v ee eee 


ciao aa 


if t2>t4 gotoB, B 






4 











a[t2] = t5 14 = a[tl] 
a[t4] =t3 | g alt2] = t14| B6 
goto B, a{tl] = t3 





5 

















图 9-9 归纳 变量 消除 之 后 的 流 图 


我 们 已 经 讨论 的 代码 改进 转换 都 是 很 有 效 的 。 和 图 9-3 中 原来 的 流 图 相 比 , 图 9-9 中 基本 块 
By AB; 中 的 指令 数目 由 4 条 减少 为 3 条 。Bs 中 的 指令 数目 由 9 条 减少 到 3 条 , 而 B6 中 的 指令 
WAH 8 条 减少 到 3 条 。 确 实 , By 中 的 指令 从 4 条 指令 增长 为 6 条 指令 , 但 是 在 这 个 代码 片断 中 
Bi 只 被 执行 一 次 , 因此 总 的 运行 时 间 几 乎 不 会 受到 Bi 的 大 小 的 影响 。 

9.1.9 9.1 节 的 练习 

练习 9. 1. 1: 对 于 图 9-10 中 的 流 图 : 

1) 找 出 流 图 中 的 循环 。 

2) By, 中 的 语句 (1) 和 (2) 都 是 复制 语句 。 其 中 c Alb 都 被 赋予 了 常量 值 。 我 们 可 以 对 a。 和 6b 
的 哪些 使 用 进行 复制 传播 , 并 把 对 它们 的 使 用 替换 为 对 一 个 常量 的 使 用 ? 在 所 有 可 能 的 地 方 进 
行 这 种 蔡 换 。 

3) 对 每 个 循环 , 找 出 所 有 的 全 局 公共 子 表达 式 。 
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A) 寻找 每 个 循环 中 的 归纳 变量 。 同 时 要 考虑 在 (2) 中 引信 的 所 有 常量 。 

5) 寻找 每 个 循环 的 全 部 循环 不 变 计算 。 

练习 9. 1. 2: 把 本 节 中 的 转换 技术 应 用 到 图 8-9 中 的 流 图 上 。 

练习 9. 1. 3: 把 本 节 中 的 转换 应 用 到 练习 8.4. 1 和 练习 8. 4. 2 中 得 到 的 流 图 中 去 。 

练习 9.1. 4: 图 9-11 中 是 用 来 计算 两 个 向 量 4 和 8B 的 点 积 的 中 间 代 码 。 尽 你 所 能 , 通过 下 列 
方式 优化 这 个 代码 : 消除 公共 子 表达 式 ,对 归纳 变量 进行 强度 消减 ,消除 归纳 变量 。 




































(l)}a=1 
(2) b = 2 
(3) c = a+b 
(4) d = c-a 
B3 
(5) d = b+d 
| 35 
_ |@) b = a+b 
6) d = atb| |P e = oa 
(7) e = etl I 
Be 
(10) a = bed 
(11) b = a-d 





— 














EXIT | if i<n goto L 
图 9-10 练习 9.1.1 的 流 图 图 9-1i 计算 点 积 的 中 交代 码 


9.2 数据 流 分 析 简 介 


在 9.1 节 中 介绍 的 所 有 优化 都 依赖 于 数据 流 分 析 。"“ 数 据 流 分 析 ” 指 的 是 一 组 用 来 获取 有 关 
数据 如 何 沿 着 程序 执行 路 径流 动 的 相关 信息 的 技术 。 比 如 , 实现 全 局 公共 子 表达 式 消除 的 方法 
之 一 要 求 我 们 确定 在 程序 的 任何 可 能 执行 路 径 上 ， 两 个 在 文字 上 相同 的 表达 式 是 否 会 给 出 相同 
的 值 。 另 一 个 例子 是 ,如果 某 一 个 赋值 语句 的 结果 在 任何 后 续 的 执行 路 径 中 都 没有 被 使 用 , ABA 
我 们 可 以 把 这 个 赋值 语句 当 作 死 代码 消除 。 这 些 以 及 很 多 其 他 重要 问题 ， 都 可 以 通过 数据 流 分 
析 来 回答 。 

9.2.1 数据 流 抽象 

从 1. 6.2 节 中 可 知 , 程序 的 执行 可 以 看 作 是 对 程序 状态 的 一 系列 转换 。 程 序 状态 由 程序 中 的 
所 有 变量 的 值 组 成 , 同时 包括 运行 时 刻 栈 的 栈 顶 之 下 各 个 栈 帧 的 相关 值 。 一 个 中 间 代 码 语句 的 
每 次 执行 都 会 把 一 个 输入 状态 转换 成 一 个 新 的 输出 状态 。 这 个 输入 状态 和 处 于 该 语句 之 前 的 程 
序 点 相关 联 ， 而 输出 状态 和 该 语句 之 后 的 程序 点 相关 联 。 

当 我 们 分 析 一 个 程序 的 行为 时 , 我 们 必须 考虑 程序 执行 时 可 能 采取 的 各 种 通过 程序 的 流 图 
的 程序 点 序列 (“路 径 ") 。 然 后 我 们 从 各 个 程序 点 上 可 能 的 程序 状态 中 抽取 出 需要 的 信息 , 用 以 
解决 特定 数据 流 分 析 问 题 。 在 更 加 复杂 的 分 析 中 , 我 们 必须 考虑 调用 和 返回 执行 时 会 形成 在 不 
同 过 程 的 流 图 之 间 跳 转 的 路 径 。 但 是 , 在 我 们 刚 开始 研究 的 时 候 , 我 们 将 关注 穿越 单个 过 程 的 音 
个 流 图 的 路 径 。 

让 我 们 看 一 下 流 图 会 给 出 哪些 关于 可 能 执行 路 径 的 信息 。 

。 在 一 个 基本 块 内 部 , 一 个 语句 之 后 的 程序 点 和 它 的 下 一 个 语句 之 前 的 程序 点 相同 。 
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e 如 果 有 一 个 从 基本 块 Bi 到 基本 块 B, 的 边 , 那么 By 的 第 一 个 语句 之 前 的 程序 点 可 能 紧 跟 
在 B, 的 最 后 一 个 语句 后 的 程序 点 之 后 。 

这 样 , 我 们 可 以 把 从 点 Pi ELA p, 的 一 个 执行 路 径 ( excution path, 简称 路 径 ) 定 义 为 满足 下 列 
条 件 的 点 的 序列 pi, ps ，…, pn: 对 于 每 个 i=1, 2,…,n-l: 

1) RA pi 是 紧 靠 在 一 个 语句 前 面 的 点 , E pi41 是 紧 跟 在 该 语句 后 面 的 点 。 

2) 要 么 p; 是 某 个 基本 块 的 结尾 , 且 pi ;1 是 该 基本 块 的 一 个 后 继 基本 块 的 开头 。 

一 般 来 说 , 一 个 程序 有 无 穷 多 条 可 能 的 执行 路 径 , 执行 路 径 的 长 度 并 没有 上 界 。 程 序 分析 把 
可 能 出 现在 某 个 程序 点 上 的 所 有 程序 状态 总 结 为 有 穷 的 特性 集合 。 不 同 的 分 析 技 术 可 以 选择 抽 
象 掉 不 同 的 信息 ,并且 一 般 来 说 , 没有 哪个 分 析 会 给 出 状态 的 完全 表示 。 


ERR ERR? 中 的 简单 程序 也 描述 了 无 限 多 个 执行 路 径 。 最 短 的 完全 执行 路 径 由 程 





序 点 (1, 2, 3, 4, 9) 组 成 , 它 不 进入 任何 循环 。 次 CS press 1 og 
短 的 路 径 执行 一 次 循环 它 由 程序 点 (1, 2,3,4, a 一 





5,6,7,8,3,4,9) 组 成 。 在 这 个 例子 中 , 我 们 知 











道 在 第 一 次 执行 程序 点 (5) 时， 因为 di 的 定 值 , a 72 
的 值 必 然 是 1。 我 们 说 di ZEB Ge aU ee 
达 了 点 (5) 。 在 其 后 的 迭代 中 , d 到 达 了 点 (5)， 





“的 值 是 243。 m 

一 般 来 说 , 跟踪 所 有 路 径 上 的 所 有 程序 状态 
是 不 可 能 的 。 在 数据 流 分 析 中 , 我 们 并 不 区 分 到 m : 

达 一 个 程序 点 的 路 径 之 间 的 差异 。 此 外 ,我 们 并 i 
不 跟踪 整个 状态 ,而 是 抽象 掉 某 些 细节 ,只 保留 进 Renee = 
行 分 析 所 需要 的 数据 。 下 面 的 两 个 例子 将 说 明 SO AMER ATE 
个 程序 点 上 的 同一 个 状态 可 以 导出 不 同 的 抽象 信息 。 

1) 为 了 帮助 用 户 调试 他 们 的 程序 , 我 们 可 能 希望 找 出 在 某 个 程序 点 上 一 个 变量 可 能 有 哪些 
值 , 以 及 这 些 值 可 能 在 哪里 定 值 。 比 如 , 我 们 可 能 对 在 程序 点 (5) 上 的 所 有 程序 状态 进行 如 下 总 
结 : a 的 值 总 是 |1, 2431 中 的 一 个 ,而 它 由 |d1 ,ds 上} 中 的 一 个 定 值 。 可 能 沿 着 某 条 路 径 到 达 菜 个 
程序 点 的 定 值 称 为 到 达 定 值 (reaching definition) o l 

2) RMN RASA EE, EERE, MENEE * 的 某 次 使 用 只 有 
一 个 定 值 可 以 到 达 , 并 且 该 定 值 把 一 个 常量 赋 给 *， 那 么 我 们 可 以 简单 地 把 x 车 换 为 该 常量 。 另 
一 方面 , 如 果 有 多 个 对 x 的 定 值 可 以 到 达 某 一 个 程序 点 ,我 们 就 不 能 对 * 进行 常量 折 冯 转换 。 因 
此 , 为 了 进行 常量 折 秋 ,我 们 希望 找到 这 样 的 定 值 : 对 于 某 个 给 定 的 程序 点 , 不管 执行 哪 条 路 径 ， 
它们 都 是 唯一 到 达 该 点 的 对 相应 变量 的 定 值 。 对 于 图 9-12 中 的 点 (5) , 没有 哪个 定 值 是 到 达 该 点 
的 对 a 的 唯一 定 值 , 因此 对 于 点 (5) 上 的 a 来 说 , 这 个 集合 是 空 的。 即使 一 个 变量 在 某 个 点 上 被 
唯一 定 值 ,该 定 值 必须 把 一 个 常量 信和 赋 给 该 变量 , 才 可 能 进行 常量 折 秋 转换 。 这 样 , 我 们 可 以 简 
单 地 把 某 些 变量 描述 成 “非常 量 ”, 而 不 是 记录 它们 所 有 可 能 的 取 值 , 或 者 所 有 可 能 的 定 值 。 

因此 , 我 们 看 到 ,根据 分 析 的 目的 , 同样 的 信息 可 以 通过 不 同 的 方式 进行 概括 。 g 
9.2.2 数据 流 分 析 模式 

在 所 有 的 数据 流 分 析 应 用 中 , 我 们 都 会 把 每 个 程序 点 和 一 个 数据 流 值 (data-flow value) 关 联 
起 来 。 这 个 值 是 在 该 点 可 能 观察 到 的 所 有 程序 状态 的 集合 的 抽象 表示 。 所 有 可 能 的 数据 流 值 的 
集合 称 为 这 个 数据 流 应 用 的 域 (domain) 。 比 如 ,到达 定 值 的 数据 流 值 的 域 是 程序 的 定 值 集合 的 
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所 有 子 集 的 集合 。 某 个 数据 流 值 是 一 个 定 值 的 集合 ,而 我 们 希望 把 程序 中 的 每 个 点 和 可 能 到 达 
该 点 的 定 值 的 精确 集合 关联 起 来 。 如 上 面 讨论 的 , 对 于 抽象 方式 的 选择 依赖 于 分 析 的 目标 。 考 
虑 到 效率 问题 , 我 们 只 跟踪 相关 的 信息 。 

我 们 把 每 个 语句 s 之 前 和 之 后 的 数据 流 值 分 别 记 为 VL s] 和 0U7T[s] 。 数 据 流 问 题 (data-flow 
problem) 就 是 要 对 一 组 约束 求解 。 这 组 约束 对 所 有 的 语句 s 限定 了 INLs] 和 0UT[s] 之 间 的 关系 。 
约束 分 为 两 种 ; 基于 语句 语义 (传递 冰 数 ) 的 约束 和 基于 控制 流 的 约束 。 

传递 函数 

在 一 个 请 名 之 前 和 之 后 的 数据 流 值 受 该 语句 的 语义 的 约束 。 上 比如 , 假设 我 们 的 数据 流 分 析 涉 及 确 
定 各 个 程序 点 上 各 变量 的 常量 值 。 如 果 变 量 a 在 执行 语句 b =a 之 前 的 值 为 v, 那么 在 该 语句 之 后 a 和 
b 的 值 都 是 v。 一 个 赋值 语句 之 前 和 之 后 的 数据 流 值 的 关系 被 称 为 传递 函数 (transfer function), ~ 

传递 函数 有 两 种 风格 : 信息 可 能 沿 着 执行 路 径 向 前 传播 ,或 者 沿 着 执行 路 径 逆向 流动 。 在 一 
个 前 向 数据 流 问 题 中 , 一 个 语句 s 的 传递 函数 (通常 被 记 为 上 ) 以 语句 前 的 数据 流 值 作为 输入 , 并 
产生 语句 之 后 的 新 数据 流 值 。 也 就 是 

OUT[s] =f,CIN[s] ) 
- 反 过 来 ,在 一 个 逆向 流 问 题 中 , 语句 * 的 传递 函数 A 把 一 个 语句 之 后 的 数据 流 值 转变 成 为 语句 之 
前 的 新 数据 流 值 。 也 就 是 : 

IN[s] =f,(OUT[s]) 

控制 流 约束 

第 二 组 关于 数据 流 值 的 约束 是 从 控制 流 中 得 到 的 。 基 本 块 中 的 控制 流 很 简单 。 如 果 一 个 基 
本 块 B 由 语句 s1， ss,…, 5, 顺序 组 成 , 那么 s; 输出 的 控制 流 值 和 输入 si,1 的 控制 流 值 相 同 。 

IN[s;,,;] =OUT[s;] 7=1,2,.…,n-l 

基本 块 之 间 的 控制 流 边 会 生成 一 个 基本 块 的 最 后 一 个 语句 和 后 继 林 本 抉 的 第 一 个 语句 之 间 
的 约束 ,这些 约束 更 加 复杂 。 比 如 ， 如果 对 可 能 到 达 一 个 程序 点 的 所 有 定 值 感 兴趣 , 那么 到 达 一 
个 基本 块 的 首 语句 的 定 值 的 集合 就 是 到 达 它 的 各 个 前 驱 基本 抉 的 最 后 一 个 语句 之 后 的 定 值 集合 
的 并 集 。 下 一 节 将 给 出 基本 块 之 间 数 据 流 的 细节 。 

9.2.3 基本 块 上 的 数据 流 模式 

从 技术 上 讲 , 数据 流 模式 涉及 程序 中 每 个 点 上 的 数据 流 值 。 但 是 如 果 我 们 认识 到 基本 块 内 
部 的 数据 流 处 理 通常 很 简单 ， 就 可 以 节约 数据 流 分 析 所 需 的 时 间 和 空间 。 控 制 流 从 基本 块 的 开 
始 流动 到 结尾 ,中间 没有 中 断 或 者 分 支 。 这 样 , 我 们 就 可 以 用 进入 和 离开 基本 块 的 数据 流 值 的 方 
式 来 重新 描述 这 个 模式 。 对 于 每 个 基本 块 B, 我 们 把 紧 靠 其 前 和 紧 随 其 后 的 数据 流 值 分 别 记 为 
IN[B] 和 OUT[B]。 关 于 IN[8] 和 OUT[8B] 的 约束 可 以 按照 下 面 的 方法 , 根据 关于 B 中 的 各 个 语 
句 s 的 IN[s] 和 OUT[s] 的 约束 得 到 。 

假设 基本 块 由 语句 s,s,,…, sn 顺序 组 成 。 如 果 s BILAL B 的 第 一 个 语句 ,那么 IN[B] 
=JIN[s]。 类 似 地 ， WR s, 是 基本 块 B 的 最 后 一 个 语句 , 那么 QUT[ 8] = OUT[s, ]。 基 本 块 8 的 
传递 函数 记 为 有, 它 可 以 通过 将 该 基本 块 中 各 语句 的 传递 函数 组 合 起 来 获得 该 传递 函数 。 也 就 
是 说 , 设 太 是 语句 ;; WERE, 那么 /5 =/,,。…。f2。f1。 该 基本 块 的 开头 和 结尾 处 的 数据 流 
值 的 关系 是 








O 原文 如 此 , 但 是 似乎 应 该 是 “数据 流 值 "。 一 一 译 者 注 
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OUTL B] =/fs(IN|LB)) i 
因 基 本 抉 之 间 的 控制 流 面 产后 的 约 东 可 以 很 容易 地 通过 重 写 得 到 , 把 原来 约束 中 的 IN[s1] 
P OUTI s, IARA IN 8] 和 OUTEB] 即 可 。 比 如 ,如 果 一 个 数据 流 值 表示 的 是 可 能 被 赋予 某 
个 变量 的 常量 集合 , 那么 我 们 就 得 到 一 个 前 向 流 问 题 , 其 中 
INC BY Sl api A UTR] 
我 们 很 快 就 会 在 处 理 活跃 变量 分 析 时 看 到 逆向 数据 流 问题 逆向 数据 流 问题 的 方程 是 类 似 
的 , 但 是 IN 和 0UT 值 的 角色 被 调换 了 。 也 就 是 说 : 
IN{ B] =f,( OUT[B]) 
OUT] = ess niy— price INES] 
各 线性 算术 方程 不 同 , 数据 流 方程 通常 没有 唯一 和解 。 我 们 的 目标 是 寻找 一 个 最 “精确 的 ” 满 
足 这 两 组 约束 ( 即 控制 流 和 传递 的 约束 ) 的 解 。 也 就 是 说 , 我 们 需要 一 个 解 , 它 能 够 支持 有 效 的 


数据 流 分 析 中 的 “保守 主义 ”部 分 对 这 个 问题 进行 了 简短 的 讨论 , 在 9.3.4 节 中 给 出 了 更 加 深入 
的 讨论 。 在 下 面 的 小 节 中 , 我 们 将 讨论 可 通过 数据 流 分 析 解 决 的 问题 的 某 些 最 重要 的 例子 。 
9.2.4 到 达 定 值 

“到 达 定 值 " 是 最 常见 和 有 用 的 数据 流 模式 之 一 。 只 要 知道 当 控 制 到 达 程 序 中 每 个 点 的 时 候 ， 
每 个 变量 * 可 能 在 程序 中 的 哪些 地 方 被 定 值 , 我 们 就 可 以 确定 很 多 有 关 zx 的 性 质 。 下 面 仅仅 给 出 
两 个 例子 : 一 个 编译 器 能 够 根据 到 达 定 值 信息 知道 x 在 点 p 上 的 值 是 否 为 常量 , 而 如 果 x 在 点 p 
上 被 使 用 , 则 调试 器 可 以 指出 x 是 否 未 经 定 值 就 被 使 用 。 

如 果 存 在 一 条 从 紧 随 在 定 值 & 后 面 的 程序 点 到 达 某 一 个 程序 点 p BRS, 并 且 在 这 条 路 径 上 
d 没有 被 “ 杀 死 ”, 我 们 就 说 定 值 d 到 达 程 序 点 p。 如 果 在 这 条 路 径 上 有 对 变量 x 的 其 他 定 值 , 我 
们 就 说 变量 * 的 这 个 定 值 被 * 杀 死 ” 了 号 。 直 观 地 讲 ， 如 果 某 个 变量 * 的 一 个 定 值 d 到 达 点 p, 在 
点 p 处 使 用 的 x 的 值 可 能 就 是 由 4d 最 后 定 值 的 。 














下 面 介绍 我 们 如 何 使 用 到 达 定 值 问题 的 解 来 探测 未 定 值 先 使 用 的 情况 。 其 窃 门 是 在 流 败 
的 人口 处 对 每 个 变量 x 引入 一 个 哑 定 值 。 如 果 * 的 哑 定 值 到 达 了 一 个 可 能 使 用 x 的 程序 点 p， 
那么 x 就 可 能 在 定 值 之 前 被 使 用 。 请 注意 , 我 们 永远 不 能 绝对 肯定 这 个 程序 包含 一 个 错误 。 
因为 有 可 能 存在 茶 种 原因 使 得 到 达 p 点 而 没有 真正 对 x 赋值 的 路 径 实际 上 并 不 存在 。 这 个 原 
因 可 能 涉及 复杂 的 逻辑 问题 。 








变量 * 的 一 个 定 值 是 (可 能 ) 将 一 个 值 赋 给 * 的 语句 。 过 程 参 数 、 数 组 访问 和 间接 引用 都 可 
以 有 别名 , 因此 指出 一 个 语句 是 否 向 特定 程序 变量 * 赋值 并 不 是 件 容易 的 事情 。 程 序 分 析 必须 是 
呆 守 的 。 如 果 我 们 不 知道 一 个 语句 是 否 给 * 贱 了 一 个 值 , 我 们 必须 假设 它 可 能 对 * 赋值。 也 就 是 
说 , 在 语句 * 之 后 , 变量 x 的 值 可 能 还 是 * 执行 之 前 的 原 值 , 但 也 可 能 变 成 了 s 所 产生 的 新 值 。 为 
简单 起 见 , 在 本 章 的 其 余部 分 我 们 假设 仅仅 处 理 没 有 别名 的 程序 变量 。 这 类 变量 包括 大 多 数 语 
言 中 的 局 部 标量 变量 。 在 处 理 C 或 者 C++ 语言 时 , 有 些 局 部 变量 的 地 址 会 被 计算 出 来 ,这 种 局 
部 变量 不 属于 这 类 变量 。 








O 注意 , 路 径 中 可 能 包含 循环 , 因此 我 们 可 能 沿 着 这 条 路 径 到 达 d 的 另 一 次 出 现 。 这 种 情况 下 , d 没有 被 * 杀 死 ” 。 
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图 9-13 中 显示 的 是 一 个 具有 7 个 定 值 的 流 图 。 让 我 们 注意 观察 所 有 到 达 基 本 块 8, 的 
定 值 。 所 有 在 B, 中 的 定 值 都 到 达 了 基本 块 By 的 开头 。 因 为 在 转 回 基 本 块 B, 的 循环 中 找 不 到 其 
他 的 对 j 的 定 值 , 基本 块 By 中 的 定 值 dj : j = j -1 也 可 以 到 达 基 本 块 B, 的 开头 。 但 是 ,这 个 定 
ARETE d: j =n, 使 得 d, 不 能 到 达 B3 和 By. Ba 中 的 语句 dy: i =i +1 却 不 能 到 达 B， 
的 开头 , 这 是 因为 变量 i 总 是 被 4): i =u3 重新 定 值 。 最 后 , EIE de: a = u2 也 能 够 到 达 B 的 
开头 。 口 
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EXIT | 


图 9-13 ”演示 到 达 定 值 的 流 图 


我 们 在 前 面 定义 到 达 定 值 时 ， 有 时 允许 一 定 的 不 精确 性 。 但 是 它们 都 是 在 “安全 "或 者 说 “ 保 
守 ” 的 方向 上 不 精确 。 比 如 , 请 注意 我 们 假设 一 个 流 图 的 所 有 边 都 可 以 通过 。 在 实践 中 这 个 假设 
可 能 是 不 正确 的 。 再 比如 , 在 下 面 的 程序 片断 中 , 没有 哪个 e 和 “的 取 值 可 以 使 得 控制 流 真 的 能 
ETIA statement 2 : 

if (a == b) statement 1; else if (a == b) statement 2; 

在 一 般 情况 下 , 决定 一 个 流 图 的 每 条 路 径 是 否 都 可 以 被 执行 是 一 个 不 可 判定 问题 。 因 此 , R 
们 简单 地 假设 流 图 中 的 每 条 路 径 都 可 能 在 程序 的 某 次 执行 时 通过 。 在 大 部 分 到 达 定 值 的 应 用 中 ， 
在 一 个 定 值 不 可 能 到 达 某 点 的 情况 下 假设 其 能 够 到 达 是 保守 的 。 因 此 , 我 们 可 以 允许 那些 在 程 
序 实际 执行 中 根本 不 会 被 遍历 的 路 径 , 我 们 也 可 以 安全 地 人 允许 定 值 穿越 某 个 对 同一 变量 的 不 明 
确定 值 。 














数据 流 分 析 中 的 保守 主义 

实际 数据 流 值 是 通过 程序 的 所 有 可 能 执行 路 径 来 定义 的 。 所 有 的 数据 流 模式 计算 得 到 的 
都 是 对 实际 数据 流 值 的 估算 。 我 们 必须 保证 所 有 的 估算 误差 都 在 “安全 ”的 方向 上 。 如 果 一 个 
策略 性 决定 不 允许 我 们 改变 程序 计算 出 的 内 容 , 它 就 被 认为 是 “安全 的 "(或 者 说 “保守 的 ”)。 
遗憾 的 是 ,安全 的 策略 会 让 我 们 错失 一 些 能 够 保持 程序 含义 的 代码 改进 机 会 。 但 实际 上 对 所 
有 的 代码 优化 技术 而 言 , 没 有 哪个 安全 的 策略 可 以 不 错失 任何 机 会 。 使 用 不 安全 策略 就 是 以 
改变 程序 含义 的 代价 来 加 快 代码 速度 。 一 般 来 说 ,这 是 不 可 接受 的 。 











a 
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出 的 任何 估算 都 是 在 “保守 "或 者 说 “安全 "的 方向 上 。 每 个 模式 和 应 用 都 要 单独 考虑 。 比 如 ， 
如 果 我 们 把 到 达 定 值 信息 用 于 常量 折 盖 ,那么 把 一 个 实际 不 可 到 达 的 定 值 当 作 可 到 达 就 是 安 
全 的 (我 们 可 能 在 < 实际 是 一 个 常量 且 可 以 被 折 益 的 情况 下 认为 不 是 一 个 常量 ) ,但 是 把 一 
个 实际 可 到 达 的 定 值 当 作 不 可 到 达 就 是 不 安全 的 (我 们 可 能 把 x 替换 为 一 个 常量 ,但 是 实际 上 
程序 有 时 会 赋予 4 一 个 不 同 于 该 常量 的 值 ) 。 











到 达 定 值 的 传递 方程 

现在 我 们 为 到 达 定 信和 问题 设置 约束 。 我 们 首先 检查 单个 语句 的 细节 。 考 虑 一 个 定 值 

d: u = vtw . 
在 这 里 ，+ 号 代表 了 一 个 一 般 性 的 二 元 运算 符 。 以 后 我 们 经 常会 这 么 做 。 

这 个 语句 “生成 * 了 一 个 变量 4 的 定 值 C, 并 “ 杀 死 >* 了 程序 中 其 他 对 w 的 定 值 , 而 进入 这 个 语 
句 的 其 他 定 值 都 没有 受到 影响 。 因 此 , EE a 的 传递 函数 可 以 被 表示 为 

falx) =geng U (x kill,) (9.1) 

其 中 gen, = |d], 即 由 这 个 语句 生成 的 定 值 的 集合 , 而 killy 是 程序 中 所 有 其 他 对 的 定 值 。 

我 们 在 9. 22 节 讨 论 过 , 一 个 基本 块 的 传递 函数 可 以 通过 把 它 包 含 的 所 有 语句 的 传递 函数 组 
合 起 来 而 构造 得 到 。 下 面 我 们 会 看 到 , 形 如 (9. 1) 的 函数 的 组 合 仍然 是 这 种 形式 。 我 们 把 这 种 形 
式 称 为 "生成 - 杀 死 形式 ” 。 假 设 有 两 个 图 数 请 (x) = gen U(x - kill) 9 f(x) = gen, U (x - 
kill,) 。 那 么 





to lx) ) = gen. U (gen, U (x — kill, ) - kill, ) 
= (gen, U (gen; — kill, ) ) U (x - Chill, U kill, ) ) 
这 个 规则 可 以 扩展 到 由 任意 多 个 语句 组 成 的 基本 块 。 假 设 基 本 块 B 有 个 语句 , 而 第 i 个 语 
句 的 传递 函数 为 上 xz) =gen;U (x 一) ,i=1,2,…, n, 那么 基本 块 B 的 传递 函数 可 以 写成 : 
fp(x) =geng U(x — killp) 
其 中 
killp = kill, U kill, UU kill, 
而 
geng =gen, U( gen, _, —kill,) U (gen, -2 — kill, _, ~ kill, ) U 
e U (egen; - kill, — kill, — +- — kill, ) 
因此 , 和 单个 语句 一 样 , 一 个 基本 块 也 会 生成 一 个 定 值 集合 并 杀 死 一 个 定 值 集合 。 集 合 gen 
中 包含 了 所 有 在 紧 靠 基 本 块 之 后 的 点 上 “可 见 ” 的 该 基本 块 中 的 定 值 一 一 我 们 把 它们 称 为 “向 下 
可 见 ”( downwards exposed) 的。 在 一 个 基本 块 中 , 一 个 定 值 是 向 下 可 见 的 , 仅 当 它 没有 被 同一 个 
基本 块 中 较 后 的 对 同一 变量 的 定 值 “ 杀 死 "。 一 个 基本 块 的 kill 集 就 是 所 有 被 块 中 各 个 语句 杀 死 
的 定 值 的 集合 。 请 注意 , 一 个 定 值 可 能 同时 出 现在 基本 块 的 gen 集 和 ki 集中。 在 这 种 情况 下 ， 
该 定 值 会 被 这 个 基本 块 生 成 , 即 优先 考虑 该 定 值 是 否 在 gen 集中 。 这 是 因为 在 gen-kill 形式 中 ， 
kill 集会 在 gen 集 之 前 被 使 用 。 


d: a=3 
dy: a=4 


的 gen 集 是 1d,| ,因为 di 不 是 向 下 可 见 的 。 基 本 块 的 kill 集 包 括 了 d, 和 ds, AA di 杀 死 了 da, 
d, 杀 死 了 dyo BRUME, 因为 减 去 kill 集 的 运算 先 于 和 gen 集 的 并 集运 算 , 这 个 基本 块 的 传递 函 

















数 的 结果 中 总 是 包含 定 值 oz 。 口 
控制 流 方程 


下 面 我 们 考虑 根据 基本 块 之 间 的 控制 流 得 到 的 约束 集合 。 因 为 只 有 一 个 定 值 能 够 沿 着 至 少 
一 条 路 径 到 达 某 个 程序 点 , 那么 这 个 定 值 就 到 达 该 程序 点 , 所 以 只 要 从 P 到 B 有 一 条 控制 流 边 ， 
OUT[ P] CIN[ 8] 就 成 立 。 然 而 , 一 个 定 值 到 达 茶 个 程序 点 的 必要 条 件 是 它 能 够 沿 着 某 条 路 径 到 
达 这 个 程序 点 , 因此 IN B] REZAT B 的 所 有 前 驱 基本 块 出 口 点 的 到 达 定 值 的 并 集 。 也 就 是 
说 ,可 以 安全 地 假设 如 下 的 方程 式 成 立 : 

NLB]= | rere OUT[ P] 

我 们 把 并 集运 算 称 为 到 达 定 值 的 交汇 运算 (meet operator) 。 在 任何 数据 流 模式 中 , 我 们 用 交 运 算 
来 汇总 各 条 路 径 会 合 点 上 不 同 路 径 所 作 的 贡献 。 

到 达 定 值 的 迭代 算法 

我 们 假设 每 个 控制 流 图 都 有 两 个 空 基本 块 , 包括 代表 了 这 个 图 的 开始 点 的 ENTRY 结 点 以 及 
EXIT 44, 所 有 离开 这 个 图 的 控制 流 都 流向 它 。 因 为 没有 定 值 到 达 这 个 图 的 开始 , 所 以 基本 块 
ENTRY 的 传递 函数 是 一 个 简单 的 返回 空 集 $8 的 常 孙 数 , 即 OUT[ ENTRY] = 0。 

到 达 定 值 问题 使 用 下 面 的 方程 定义 : 

OUT[ ENTRY] = 6 
上 且 对 于 所 有 的 不 等 于 ENTRY 的 基本 块 B, 有 
OUT[B] = geng U (IN[B] -pills) 
IN[B] =|] enn-timerg OUTP] 

可 以 使 用 下 面 的 算法 来 求 这 个 方程 组 的 解 。 这 个 算法 的 结果 是 这 个 方程 组 的 最 小 不 动 点 (least 
fixedpoint) ， 即 对 于 各 个 JN 和 OUT, 这 个 解 给 出 的 值 总 是 此 方程 组 的 其 他 解 所 给 出 的 值 的 子 集 。 
下 面 这 个 算法 的 结果 是 可 接受 的 , 因为 在 某 个 IN 或 0UT 集中 的 定 值 确实 可 以 到 达 该 IN 或 OUT 
所 描述 的 程序 点 。 这 个 解 也 是 我 们 所 期 望 的 , 因为 它 没有 包含 任何 我 们 确定 不 会 到 达 的 定 值 。 
iz 9. 11 到 达 定 值 。 

输入 : 一 个 流 图 , 其 中 每 个 基本 块 B 的 kile ÆA geng 集 都 已 经 计算 出 来 。 

输出 : 到 达 流 图 中 各 个 基本 块 B 的 人 口 点 和 出 口 点 的 定 值 的 集合 , 即 IN[B8] 和 OUT[ Bj]。 

方法 : 我 们 使 用 迭代 的 方法 来 求解 。 一 开始 , 我 们 “估计 ”对 于 所 有 基本 块 B 都 有 OUT[B] = 
0, 并 逐步 逼近 想 要 的 IN 和 OUT 的 值 。 因 为 我 们 必须 不 停 迭 代 直 到 各 个 IN 值 (因此 各 个 OUT 值 
tH) Wich, 所 以 我 们 可 以 使 用 一 个 布尔 变量 change 来 记录 每 次 扫描 各 基本 块 时 是 否 有 OUT 值 发 
生 改变 。 但 是 , 在 此 算法 及 以 后 描述 的 类 似 算法 中 , 我 们 假设 用 来 跟踪 变更 情况 的 确切 机 制 是 可 
理解 的 , 因此 我 们 删除 了 这 些 细节 。 

图 9-14 中 粗略 地 给 出 了 这 个 算法 。 前 两 行 对 某 些 数据 流 值 进行 了 初始 化 SS。 从 第 (3) 行 开始 
是 一 个 循环 。 在 循环 中 我 们 不 停 地 迭代 直到 各 个 值 收 合 。 第 (4) 行 到 第 (6) 行 组 成 的 内 层 循 环 对 
和 信 口 结 点 之 外 的 所 有 基本 块 应 用 数据 流 方程 。 口 

直观 地 讲 , 算法 9. 11 尽量 向 前 传播 各 个 定 值 , 直到 该 定 值 被 杀 死 , 这 样 做 模拟 了 程序 的 所 有 
可 能 的 执行 情况 。 算 法 9. 11 最 终 必然 会 终止 , 因为 对 于 每 个 ,OUT[B] 绝 对 不 会 变 小 。 一 旦 茶 











O 细心 的 读者 可 能 会 注意 到 , 可 以 很 容易 把 (1) 、(2) 两 行 合并 。 但 是 ,在 类 似 的 数据 流 算法 中 ,初始 化 人 口 结 点 或 
出 口 结 点 时 用 的 方法 可 能 和 初始 化 其 他 结 点 的 方法 不 同 。 因 此 我 们 依照 所 有 的 途 代 算法 的 模式 ， 即 像 行 (1) 那 人 
应 用 “边界 条 件 "的 动作 ,与 行 (2) 中 的 初始 化 动作 分 开 进行 。 
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个 定 值 被 加 入 到 OUT 值 中 , 它 会 一 直 待 在 那里 。( 见 练习 9.2.6。) 因 为 所 有 定 值 的 集合 是 有 限 
的 , 最终 必然 有 一 趟 while 循环 的 执行 没有 向 任何 OUT 加 入 任何 内 容 。 此 时 算法 就 终止 了 。 在 此 
时 终止 迁 代 是 安全 的 ， 因 为 如 果 各 个 OUT 值 没有 改变 ,下 一 趟 中 各 个 IN 值 也 不 会 改变 。 而 如 果 各 
ASIN 值 没有 改变 ,OUT 值 也 不 会 改变 , 如 此 下 去 , 所 有 后 续 的 迭代 都 不 会 改变 IN 和 OUT 的 值 。 

流 图 中 的 结 点 个 数 是 while 循环 的 迭代 次 数 的 上 界 。 其 理由 是 如 果 一 个 定 值 能 够 到 达 某 个 程 
序 点 , 它 必 然 可 以 通过 无 环 的 路 径 到 达 该 点 ,而 一 个 流 图 中 的 结 点 个 数 是 无 环 路 径 中 结 点 数 的 上 
界 。 在 while 循环 的 每 次 类 代 中 ,每 个 定 值 至 少 沿 着 问题 中 的 路 径 前 进 一 个 结 点 。 而 且 , 根据 各 
个 结 点 在 内 层 循环 中 被 访问 的 顺序 ， 它 经 常 一 次 前 进 多 个 结 点 。 

实际 上 , 如 果 我 们 适当 地 安排 第 (4) 行 中 for 循环 访问 基本 块 的 顺序 ,经 验 表明 while 循环 的 
平均 迭代 次 数 小 于 5( 见 9.6.7 节 ) 。 央 为 定 值 的 集合 可 以 使 用 位 向 量 表示 , 而 这 些 集合 的 运算 可 
以 使 用 位 向 量 上 的 逻辑 运算 来 实现 ,算法 9. 11 在 实际 应 用 中 出 奇 地 高 效 。 
三 丽 国 我 们 将 使 用 位 向 量 来 表示 图 9-13 中 的 七 个 定 值 4 , dy, =, dy。 其 中 左 起 第 i 个 位 表 
示 才 。 集 合 的 并 运算 通过 相应 的 位 向 量 的 逻辑 OR 运算 实现 。 两 个 集合 的 差 5-7 的 计算 方法 是 首 





” 先 计算 了 的 位 向 量 的 补 , 然后 再 将 这 个 补 和 5 的 位 向 量 进行 迎 辑 AND 运算 。 

















图 9-15 中 显示 的 是 算法 9.11 中 的 IN 和 [oven 
OUT 集 的 取 值 。 其 初始 值 用 上 标 0 表示 ,如 |2) for ( 除 ENTRY 之 外 的 每 个 基本 块 B) OUTIS] = b; 
OUTER]. “E(t eh 9-14 A038 (2) 778g | eee et ee MLE PAB) { 
环 赋值 。 它 们 都 是 空 集 ,用 比特 向 量 |5 inte = Upwear -ryn OUTIP I: 
000 0000 表示 。 算法 的 后 绪 迭 代 中 的 取 值 也 6) ; OUT[B] = geng U (IN[B] — hilly); 
使 用 上 标 表示 , 第 一 趟 迭代 的 值 标 记 为 
IN[B] "和 0UT[8]', 第 二 趟 迭代 的 值 标 记 o 图 9-14 计算 到 达 定 值 的 迭代 算法 


为 IN[81? 和 和 OUT[B]?。 
假设 第 (4) 行 到 第 (6) 行 的 for 循环 在 执行 时 , B 依次 取 值 
By B,, Bs, B4, EXIT 
X B=B, 时 ,因为 OUT[ ENTRY] = @, 所 以 INLB1]! 是 空 集 , 而 OUT[ Bi]' 等 于 geng 。 这 个 值 
和 前 面 的 值 OUT[ B81]° 不 同 , 因此 我 们 知道 在 第 一 轮 中 有 些 值 发 生 了 变化 (因此 会 继续 进行 第 二 
次 循环 ) 
然后 我 们 考虑 B= 8B,, 并 计算 
IN[ B,] = OUT[B, ]! VOUT[B, ]° 
=111 000 +000 0000 = 111 0000 
OUT[ B, ]! = genp, U (INL By ]' ~ kill, ) 
=000 1100 + (111 0000 - 110 0001) =001 1100 
这 个 计算 过 程 在 图 9-15 中 做 了 概括 。 比 如 , ES BRM JA, OUT[B,]' =001 1100, 反应 
T dy 和 ds 在 Bs 中 生成 的 事实 , 而 d 到 达 了 B 的 开头 但 是 没有 在 B, 中 被 杀 死 。 
请 注意 , 在 第 二 轮 之 后 , OUT[ 8, ] 的 值 有 所 改变 , 反映 了 de 也 到 达 B, 的 开头 且 没 有 被 B, 
杀 死 。 在 第 一 趟 中 我 们 没有 了 解 到 这 个 事实 , 因为 从 ds 到 B, 结尾 的 路 径 ( 即 By 一 B4 一 B, ) 没 有 
在 一 趟 中 被 顺序 经 过 。 也 就 是 说 ， 当 我 们 知道 ds 到 达 B, 的 结尾 时 ,我 们 已 经 在 第 一 趟 中 计算 了 
IN( B, ] 和 OUT[ By J. 
在 第 二 趟 之 后 , OUT 集合 中 的 所 有 值 都 没有 改变 。 因 此 , 算法 在 第 三 趟 之 后 终止 。 此 时 , 各 
个 IN 和 OUT 的 值 如 图 9-15 中 最 后 两 列 所 示 。 口 
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Block B | ovr{B) | INIBP | our[By | in(BP | ouT[B] 

By 000 0000 000 0000 | 111 0000 | 000 0000 | 111 0000 
Bo 000 0000 | 111 0000 | 001 1100 | 111 0111 | 001 1110 
Bs 000 0600 | 001 1100 | 000 1110 | 001 1110 | 000 1110 
By 000 0000 | 001 1110 | 001 0111 | 001 1110 | 001 0111 
EXIT 000 0000 | 001 6111 | 001 0111 | 001 0111 | 001 0111 




















图 9-15 IN A OUT 的 计算 过 程 


9.2.5 活跃 变量 分 析 

有 些 代码 改进 转换 所 依赖 的 信息 是 按照 程序 控制 流 的 相反 方向 进行 计算 的 ,我 们 现在 将 要 
研究 这 样 的 一 个 例子 。 在 活跃 变量 分 析 ( live-variable analysis) 中 , 我 们 希望 知道 对 于 变量 * 和 程 
序 点 p, x 在 点 p 上 的 值 是 否 会 在 流 图 中 的 某 条 从 点 p 出 发 的 路 径 中 使 用 。 如 果 是 , 我 们 就 说 «在 
p 上 活跃 ; 否则 就 说 * 在 p 上 是 死 的 。 

活路 变量 信息 的 重要 用 途 之 一 是 为 基本 块 进行 寄存 器 分 配 。 在 8.6 节 和 8.8 节 中 已 经 介绍 
了 这 个 问题 的 某 些 方面 。 在 一 个 值 被 计算 并 保存 到 一 个 寄存 器 中 后 , 它 很 可 能 会 在 基本 块 中 使 
用 。 如 果 它 在 基本 块 的 结尾 处 是 死 的 , 就 不 必 在 结尾 处 保存 这 个 值 。 另 外 ,在 所 有 寄存 器 都 被 占 
用 时 ,如 果 我 们 还 需要 申请 一 个 寄存 器 的 话 , 那么 应 该 考虑 使 用 一 个 存放 了 已 死亡 的 值 的 寄存 
器 ， 因 为 这 个 值 不 需要 保存 到 内 存 。 

这 里 我 们 直接 以 IN[ 8] 和 OUT, B] 的 方式 定义 数据 流 方程 。IN[ 8 和 OUT[ B] 分 别 表示 在 紧 千 
基本 块 B 之 前 和 紧 随 B 之 后 的 点 上 的 活路 变量 集合 。 这 些 方程 可 以 通过 以 下 的 方法 得 到 : 首先 定义 
各 个 语句 的 传递 函数 ,然后 再 把 它们 组 合 起 来 得 到 一 个 基本 块 的 传递 函数 。 我 们 给 出 下 面 的 定义 : 

1) defs 是 指 如 下 变量 的 集合, 这 些 变量 在 8 中 的 定 值 ( 即 被 明确 地 赋值 ) 先 于 任何 对 它们 的 
使 用 。 

2) usen 是 指 如 下 变量 的 集合 , 它们 的 值 可 能 在 B 中 先 于 任何 对 它们 的 定 值 被 使 用 。 
UREE tin, 图 9-13 中 的 基本 块 8, 一 定 使 用 了 i。 除非 i 和 j 互 为 对 方 的 别名 , 否则 会 在 对 j 
的 任何 重新 定 值 之 前 使 用 j。 假 设 图 9-13 中 的 变量 之 间 没有 别名 关系 , 那么 usep, = fi, jlo Bh, 
B, 显然 对 i 和 j 定 值 。 假 设 没有 别名 问题 , 因为 B, 在 定 值 之 前 使 用 了 i 和 j, 所 以 defa, =1 1。 O 

根据 这 些 定义 ,uses 中 的 任何 变量 都 必然 被 认为 在 基本 抉 B 的 入 口 处 活跃 , 而 defy 中 的 变 
量 在 B 的 开头 一 定 是 死 的 。 实 际 上 ,defs 中 的 成 员 * 杀 死 "了 某 个 变量 可 能 因 从 B 开始 的 某 条 路 
径 而 成 为 活跃 变量 的 任何 机 会 。 

这 样 , 把 def 和 use 与 未 知 的 IN 和 OUT 值 联系 起 来 的 方程 定义 如 下 : 

IN[ EXIT] = 9 
且 对 于 所 有 的 不 等 于 EXIT 的 基本 抉 来 说 : 
IN[ B] = usep U (OUT[ B] ~ defy) 
OUT[B] = Use —rmane INT 3] 

第 一 个 方程 描述 了 边界 条 件 ， 即 在 程序 的 出 口 处 没有 变量 是 活跃 的。 第 二 个 方程 说 明 一 个 
变量 要 在 进入 一 个 基本 块 时 活跃 , 必须 满足 下 面 两 个 条 件 中 的 一 个 : 要 么 它 在 基本 块 中 被 重新 定 
值 之 前 就 被 使 用 ; 要 么 它 在 离开 基本 块 时 活跃 且 在 基本 块 中 没有 对 它 重 新 定 值 。 第 三 个 方程 说 
一 个 变量 在 离开 一 个 基本 块 时 活跃 当 且 仅 当 它 在 进入 该 基本 块 的 某 个 后 继 时 活跃 。 

应 该 注意 一 下 活路 性 方程 和 到 达 定 值 方程 之 间 的 关系 : 

。 两 组 方程 都 以 并 集运 算 作为 交汇 运算 。 其 原因 是 在 各 个 数据 流 模式 中 , 我 们 都 沿 着 路 径 

传播 信息 ,并 且 我 们 只 关心 是 否 存在 任何 路 径 具 有 我 们 想 要 的 性 质 , 而 不 是 关心 某 些 结 
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论 是 否 在 所 有 的 路 径 上 都 成 立 。 

o 但是, TBR MEST AA Bat ae Ita a, 这 和 控制 流 的 方向 相反 。 基 中 的 原因 是 在 这 个 问题 中 ， 
我 们 试图 保证 在 一 个 程序 点 p 上 对 变量 x 的 使 用 可 以 被 传递 到 在 某 个 执行 路 径 中 之 前 
的 所 有 程序 点 , 这 样 我 们 才 知 道 在 前 面 的 这 些 点 上 x 的 值 会 被 使 用 。 

为 了 解决 一 个 逆向 传播 的 数据 流 问 题 , 我 们 对 IN[ EXIT] (而 不 是 OUT[ ENTRY ] ) 进行 初始 

化 。IN 和 OUT 集合 的 角色 相互 对 调 了 ，use 和 def HART gen 和 RU。 和 到 达 定 值 问题 一 样 ， 

活跃 性 方程 的 解 不 必 是 唯一 的 , 且 我 们 希望 得 到 具有 最 小 活跃 变量 集合 的 解 。 解 方程 时 使 用 的 算 














法 本 质 上 是 算法 9. 11 的 逆向 传播 版 本 。 one 

活路 变量 分 析 。 E a IN[B] = ; 
输入 : 一 个 流 图 , 其 中 每 个 基本 块 的 use 和 def eat ee 

已 经 计算 出 来 。 ed 
输出 : 该 流 图 的 各 个 基本 块 B 的 入 口 和 出 口 } 

处 的 活跃 变量 集合 , 即 IN[B] 和 OUT[B]。 

， 方法 : 执行 图 9.16 中 的 程序 。 a 图 9-16 ATRAEM 

9.2.6 ”可 用 表达 式 
如 果 从 流 图 人 口 结 点 到 达 程序 点 p 的 每 条 路 径 都 对 表达 Jest ay RH, 有 目 从 最 后 一 个 这 样 的 


求 值 之 后 到 p 点 的 路 径 上 没有 再 次 对 * 或 y 赋 值 , 那么 x*+y 在 点 p 上 可 用 (available)。 对 于 可 
用 表达 式 数 据 流 模式 而 言 ,如果 一 个 基本 块 对 x 或 了 赋值 (或 可 能 对 它们 赋值 ) , 并 且 之 后 设 有 再 
重新 计算 x+y, 我 们 就 说 该 基本 块 “ 杀 死 * 了 表达 式 x +y。 如 果 一 个 基本 块 一 定 对 x+y 求 值 , 并 
且 之 后 没有 再 对 x 或 y 定 值 , 那么 这 个 基本 块 生成 表达 式 x + yo 


























请 注意 ,“ 杀 死 " 或 "生成 一 个 可 用 表达 式 的 概念 和 达到 定 值 中 的 概念 并 不 完全 相同 。 尽 管 
如 此 , 这 些 “ 杀 死 "或 “生成 "的 概念 在 行为 上 和 到 达 定 值 中 的 相 thsi | 
应 概念 在 本 质 上 是 一 致 的 。 

可 用 表达 式 信息 的 主要 用 途 是 寻找 全 局 公共 子 表达 式 。 比 =a 
”如 , 在 图 9-17a 中 , 如 果 4 * 在 基本 块 B 的 人 口 点 可 用 ,那么 基 一 一 
AR B, 中 的 表达 式 4* 就 是 一 个 公共 子 表达 式 。 它 在 该 处 可 用 “Pat a, 
的 条 件 是 i 在 基本 块 B。 中 没有 被 赋予 一 个 新 值 , 或 者 像 图 9-17b z 
所 示 的 那样 在 B, 中 对 i 赋值 后 又 重新 计算 了 4 * i。 : 

我 们 可 以 从 头 到 尾 地 处 理 基 本 块 内 的 各 个 语句 , 计算 一 cra 
本 块 内 各 个 点 上 生成 的 表达 式 的 集合 。 在 基本 块 前 面 的 点 上 没有 
任何 生成 的 表达 式 。 如 果 在 点 p 处 可 用 表达 式 的 集合 是 5, 而 4 
是 p 之 后 的 点 , 且 它 们 之 间 是 语句 x =y +2, 那么 通过 下 面 的 两 
个 步骤 可 得 到 点 9 上 的 可 用 表达 式 集合 。 oa 

1) 把 表达 式 y+z 添加 到 S 中 。 

2) 从 S 中 删除 任何 涉及 变量 * 的 表达 式 。 图 9-17 跨越 多 个 基本 块 的 


请 注意 , 因为 x 可 能 和 y 或 z 相 同 , 所 以 上 面 的 步骤 必须 按照 潜在 的 公共 子 表 达 式 
正确 的 顺序 执行 。 在 我 们 到 达 基 本 块 的 结尾 处 时 ,5 就 是 该 基本 





O WHER, 如 在 本 章 中 通常 使 用 的 , 我 们 使 用 运算 符 + 来 代表 一 个 一 般 性 的 运算 符 , 不 是 一 定 指 加 法 运算 。 
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块 生成 的 表达 式 集 合 。 而 被 杀 死 的 表达 式 的 集合 就 是 所 有 类 似 于 y+z 的 表达 式 , 其 中 y 或 z 在 基 
本 块 中 被 定 值 ,并 且 这 个 基本 块 没 有 生成 Y+ze 




















JRB 考虑 图 9-18 中 的 四 个 语句 。 在 第 一 个 语句 之 后 4+c 可 用 。 在 第 二 个 语句 之 后 a-4 
变 得 可 用 , 但 是 因为 上 被 重新 定 值 , b+ e 变 得 不 再 可 用 。 BS GER THe 
个 语句 并 没有 使 4+e 可 用 ,因为 。 的 值 立 刻 就 被 改变 了 。 在 最 | ，，. 0 
后 一 个 语句 之 后 , 因为 4 的 值 已 经 改变 , a-d 不 再 可 用 。 因 此 ead 
这 个 基本 块 没有 生成 任何 可 用 表达 式 , 所 有 涉及 a、5、c、d 的 ja 4 et 
表达 式 都 被 杀 琵 了 。 O c=bte 

我 们 可 以 用 类 似 于 计算 到 达 定 值 的 方法 来 寻找 可 用 表达 Jaana ie a 
Ro Bi U 是 所 有 出 现在 程序 中 一 个 或 多 个 语句 的 右 部 的 表达 o 











式 的 全 集 。 对 于 每 个 基本 块 B, 令 INB] ERE B 的 开始 处 可 
用 的 U 中 的 表达 式 的 集合 。 令 OUT 8] 表 示 在 B 的 结尾 处 可 用 
的 表达 式 集合 。 定 义 。_gens 为 8 生 成 的 表达 式 的 集合 , W ekile 为 被 B AGEN) U 中 的 表达 式 的 
集合 。 请 注意 , IN, OUT, egen 和 e_kill 都 可 以 使 用 位 向 量 表 示 。 下 面 的 方程 给 出 了 未 知 的 IN 和 
OUT AZM, 以 及 它们 和 已 知 量 egen 5 ekil 之 间 的 关系 : : 
OUT[ ENTRY] = @ 
并 且 对 于 除 ENTRY 之 外 的 所 有 基本 块 B,， 有 
OUTI B] =e_genpU (IN[B] - e_killp) 
INDB] =È pearing OUTP] 

上 面 的 方程 和 到 达 定 值 方程 组 看 起 来 几乎 一 样 。 和 到 达 定 值 类 似 , 这 个 方程 组 的 边界 条 件 
也 是 OUT[ ENTRY] = 0, 这 是 因为 在 ENTRY 的 出 口 处 没有 任何 可 用 表达 式 。 其 中 最 重要 的 不 同 
之 处 在 于 这 个 方程 组 的 交汇 运算 是 交集 运算 , 而 不 是 并 集运 算 。 因 为 只 有 当 一 个 表达 式 在 一 个 
基本 块 的 所 有 前 驱 的 结尾 处 都 可 用 , 它 才 会 在 该 基本 块 的 开头 可 用 ,因此 使 用 交集 运算 是 正确 
的 。 相 反 ， 只 要 一 个 定 值 到 达 了 一 个 基本 块 的 任何 一 个 前 驱 的 结尾 处 , 它 就 到 达 了 该 基本 块 的 开 
Sk, 所 以 在 到 达 定 值 方程 组 中 使 用 并 集运 算 作为 交汇 运算 。 

使 用 六 而 不 是 UU 使 得 可 用 表达 式 方程 组 的 表现 和 到 达 定 值 方程 组 的 表现 不 同 。 虽然 两 组 方 
程 都 没有 唯一 解 , 但 到 达 定 值 方程 组 的 解 是 符合 “到 达 ” 的 定义 的 最 小 集合 。 在 求解 到 达 定 值 方 
程 的 过 程 中 , 我 们 首先 假设 任何 地 方 都 没有 定 值 到 达 , 然后 逐渐 增 大 到 达 定 值 的 集合 ,最终 构 建 
得 到 该 解 。 在 这 个 方法 里 ,除非 找到 一 条 能 把 某 个 定 值 d 传播 到 某 个 点 p 的 实际 路 径 , 否则 我 们 
从 来 不 假设 d 能 够 到 达 p。 相 反 , 对 于 可 用 表达 式 方程 组 ,我 们 希望 得 到 具有 最 大 可 用 表达 式 集 
合 的 解 。 因 此 , 我 们 首先 给 出 较 大 的 近似 值 , 然后 逐步 消减 。 

首先 , 我 们 假设 “在 除了 和 人口 基本 块 结尾 处 之 外 的 所 有 地 方 , 所 有 表达 式 ( 即 集合 0) 都 是 可 用 
的 "。 只 有 当 我 们 发 现 有 一 条 路 径 使 得 某 个 表达 式 不 可 用 时 , 我 们 才 删 除 这 个 表达 式 。 这 种 方法 看 
起 来 不 是 那么 显而易见 , 但 是 我 们 可 以 得 到 一 个 真正 的 可 用 表达 式 的 集合 。 在 处 理 可 用 表达 式 时 ， 
生成 一 个 可 用 表达 式 的 精确 集合 的 子 集 是 保守 的 。 之 所 以 说 使 用 子 集 是 保守 的 , 是 因为 我 们 将 把 这 
个 信息 用 于 把 -一 个 可 用 表达 式 的 计算 替换 为 之 前 计算 得 到 的 值 。 不 知道 一 个 表达 式 是 可 用 的 只 会 
使 我 们 失去 改进 代码 的 机 会 ,而 把 一 个 不 可 用 的 表达 式 认为 可 用 则 会 使 我 们 改变 程序 的 计算 结果 。 
DEG REEERE TER 9-19 中 的 基本 块 B。 上, 说明 OUT[ B, ] 的 初始 近似 值 对 
IN[ By ] 的 影响 。 令 G 入 分别 为 e_genp, Al e kilp, 的 缩写 。B, 的 数据 流 方程 为 

IN[ 8,] = OUT[ B, ] NOUTI B,J 


图 9-18 ”可 用 表达 式 的 计算 
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OUT[ B,] =GUCIN[ B,] -K) 一 一 一 一 
S PR OF 分 别 表示 IN[ B, ] A OUT By 的 第 7 次 循环 计算 得 到 的 近似 值 ， ES 


REFE AAE E FI ARIER: E 
H+! =OUTL BNO p 
l l B, 
T 


git! =GU(P*! -K) 
从 Oo = 人 开始 , BASH = OUTLB,] NO° = p 但 是 , MRENA 0° a 
=U 开始, 那么 我 们 得 到 媚 = OUT[ Bi] N0? = OUT[ B ] ,而 这 才 是 我 们 图 919 将 OUT 集合 
应 该 得 到 的 值 。 直 观 地 讲 ， 以 00 = 上 作为 初始 值得 到 的 解 更 符合 我 们 的 TEA ARERR 
期 望 , 因为 这 个 解 正确 地 反映 了 下 面 的 事实 : 如 果 OUT[ 81] 中 的 某 个 表 
达 式 没有 被 B, ATE, MACHE By 的 结尾 处 可 用 。 = 
| 可 用 表达 式 。 
输入 ; 一 个 流 图 ， 对 其 中 的 每 个 基本 块 B，e_kills F egens 的 值 已 经 计算 得 到 。 流 图 的 初始 
基本 块 是 Bi 。 OUT[ENTRY}] = @; 
输出 : 在 流 图 的 各 个 基本 块 妃 的 人 口 处 | for (Bk ENTRY 之 外 的 每 个 基本 块 B) ovT[B] =U; 


NE - tA H TE: while (424. ouT 值 发 生 了 改变 ) 
和 出 口 处 的 可 用 表达 式 集合 ， 即 INLB8] 和 for ( 除 ENTRY 之 外 的 每 个 基本 块 召 ) { 























OUT[ B]. IN[B] =N pupe puy OUTIP; 

方法 : 执行 图 9-20 中 的 算法 。 图 920 | OUT[B] = e_geng U (IN[B] — e_killp); 
中 各 个 步骤 的 解释 类 似 于 图 9-14 的 算法 中 = 
的 解释 。 口 图 9-20 计算 可 用 表达 式 的 迭代 算法 
9.2.7 小 结 


在 本 节 中 , 我 们 讨论 了 数据 流 问 题 的 三 个 实例 : 到 达 定 值 、 活跃 变量 和 可 用 表达 式 。 如 
图 9-21 中 所 总 结 的 ,每 个 问题 的 定义 都 是 通过 数据 流 值 的 域 、 数 据 流 的 方向 、 传 递 函 数 族 、 边 界 
条 件 和 交汇 运算 来 定义 的 。 我 们 一 般 用 人 表示 交汇 运算 。 

图 9-21 的 最 后 一 列 显示 了 和 迭代 算法 中 使 用 的 初始 值 。 我 们 选择 这 些 值 的 目的 是 使 得 迭代 算 
法 可 以 找到 方程 组 的 最 精确 解 。 严 格 地 讲 ， 这 个 选择 并 不 是 数据 流 问题 的 定义 的 一 部 分 ,因为 它 
是 为 满足 迭代 算法 的 需要 而 人 工 给 出 的 产品 。 还 有 其 他 途径 可 以 解决 数据 流 问 题 。 比 如 , 我 们 
已 经 看 到 了 如 何 把 一 个 基本 块 中 各 个 语句 的 传递 函数 组 合 起 来 得 到 该 基本 抉 的 传递 函数 。 我 们 
可 以 用 类 似 的 组 合 方法 来 计算 整个 过 程 的 传递 函数 , 或 者 计算 从 过 程 的 入 口 处 到 各 个 程序 点 的 
传递 函数 。 我 们 将 在 9.7 节 中 讨论 这 类 方法 的 其 中 一 种 。 



































到 达 定 值 活跃 变量 可 用 表达 式 
域 定 值 的 集合 变量 的 集合 KARES 
方向 前 向 | 后 向 前 向 
传递 geng U (x — killa) usen U (x — defy) e-genp U (x ~ ekillp) 
边界 条 件 OUT[ENTRY] = 9 IN[EXIT] = 9 OUT[ENTRY] = 
| 交汇 运算 (A) | U y a See 
方程 组 OUT{[B] = fa(IN[B]) | IN[IB] = fg (OUTIB]) | OUT[B] = 大 (INIB]) 
IN[B) = OUT[B] = IN[B] = 

| AppreaBy OUTIP] | AsisucccayINIS] | Ar preatay OUTIPI 

初始 值 OUT{B] = 6 IN[B] = 0 OUT[B] = 




















图 9-21 三 个 数据 流 问 题 的 总 结 
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9.2.8 9.2 节 的 练习 

练习 9. 2. 1: 对 图 9-10 中 的 流 图 ( 见 9.1 节 的 练习 ), 计算 下 列 值 : 

1) 每 个 基本 块 的 gen 各 kill A, 

2) 每 个 基本 块 的 IN 和 OUT 集合 。 

练习 9. 2.2: 对 图 9-10 的 流 图 ,计算 可 用 表达 式 问题 中 的 esgen , ekil, IN Ml OUT EG. 

练习 9. 2. 3: 对 图 9-10 的 流 图 , 计算 活 斤 变量 分 析 中 的 def use, IN 和 OUT 集合 。 

| 练习 9. 2. 49 : 假设 了 是 复数 的 集合 。 下 面 的 哪个 运算 可 以 被 用 作 了 上 的 一 个 半 格 结构 的 
交汇 运算 ? 

1) 加 法 : (a +ib) A (e+ id) =(a+c) +i(b+d) 

2) FE: (a +ib) A(c+id) =(ac—bd) + i(ad + be) 

3) 按 分 量 求 最 小 : (a + ib) A(e+id) =min(a, c) +i min(d, d) 

4) 按 分 量 求 最 大 : (atib) A (c+ id) =max(a, c) +i max(b, d) 

| 练习 9. 2.5; 我 们 曾经 说 过 , 如 果 一 个 基本 块 B 由 n 个 语句 组 成 , 并且 第 ; 个 语句 的 gen 集 
AM kill RAGA gen; 和 kill,, 那么 基本 块 B 的 传递 函数 的 gen A geng 和 kill EF kill, 可 以 
由 下 面 的 公式 给 出 : 








killp = kill, U kill U + U kill, 
geng =gen, U (genn -1 — kill, ) U (geng3 — fill, 1 ~ kill, ) U 
e+ U (gen; — kill, - kill, - +++ = kill, ) 

HRX n 的 归纳 来 证 明 这 个 说 法 。 

| 练习 9. 2. 6: 请 通过 对 算法 9.11 中 第 (4) 到 第 (6) 行 的 for 循环 的 迭代 次 数 的 归纳 ,证 明 
IN 和 OUT 的 值 都 不 会 缩小 。 也 就 是 说 ,一 但 某 个 定 值 在 某 次 循环 的 时 候 被 放 到 其 中 的 一 个 集合 
H, 它 决 不 会 在 以 后 的 某 次 循环 中 消失 。 

| 练习 9.2.7: 证 明 算 法 9.11 的 正确 性 ,也 就 是 证 明 : 

1) 如 果 定 值 4 被 放 到 IN[8] 或 OUT[B8] 中 , 那么 相应 地 必然 有 一 条 从 d 到 基本 块 B 的 开始 
处 或 结尾 处 的 路 径 。 在 这 条 路 径 中 ,由 4 定 值 的 变量 不 会 被 重新 定 值 。 

2) 如 果 定 值 4 最 后 没有 被 放 到 IN[B] 或 0UT[ 8] 中 , 那么 相应 地 必然 没有 从 d 到 基本 块 B 
的 开始 处 或 结尾 处 的 路 径 。 在 这 条 路 径 中 ,由 d 定 值 的 变量 不 会 被 重新 定 值 。 

! 练习 9. 2. 8: 证 明 有 关 算法 9. 14 的 下 列 性 质 : 

1) & IN 和 OUT 的 值 不 会 缩小 。 

2) 如 果 变 量 * 被 放 到 IN[B] 或 OUTLB3] 中 , 那么 相应 地 有 一 条 从 基本 块 B 的 开始 处 或 结尾 
处 出 发 的 路 径 , 在 这 条 路 径 上 x 可 能 被 使 用 。 

3) 如 果 变 量 * 没有 被 放 到 IN[Bj 或 OUTLB] 中 , 那么 相应 地 没有 从 基本 块 B 的 开始 处 或 结 
尾 处 出 发 的 路 径 , 使 得 x 在 这 条 路 径 上 被 使 用 。 





m 












为 什么 可 用 表达 式 算 法 是 正确 的 

我 们 需要 解释 一 下 为 什么 下 面 的 结论 成 立 ,， 即 在 一 开始 的 时 候 把 人 口 基本 块 之 外 的 其 他 

所 有 基本 块 的 OUT 值 都 设置 为 U( 即 所 有 表达 式 的 集合 ), 最 终 仍 可 以 得 到 这 些 数 据 流 方程 的 
保守 解 . 也 就 是 说 ,找到 的 可 用 表达 式 确 实 都 是 可 用 的 。 第 一 ,因为 在 这 个 数据 流 模 式 中 的 








O 本 练习 在 9.3 节 之 后 完成 。 
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交汇 运算 是 交集 运算 ， 任何 发 现 x x+y te 某 个 程序 F 点 上 不 可 用 的 理 由 部 会 在 流 图 中 沿 着 所 有 可 
能 的 路 径 向 前 传播 , 直到 x +y 被 重新 计算 并 再 次 变 得 可 用 为 止 。 第 二 , 只 有 两 个 理由 可 能 会 
使 x+y 变 成 不 可 用 的 。 

1) 因为 x 或 y 在 基本 块 8 中 被 定 值 且 其 后 没有 计算 x+y, 因此 x+y 被 杀 死 。 在 这 种 情 
况 下 , 我 们 第 一 次 应 用 传递 函数 户 的 时 候 , x +y 就 会 从 OUT[B] 中 被 删除 。 

2) 在 某 些 路 径 中 , x+y 一 直 没 有 被 计算 。 因 为 x+y 肯定 不 会 在 OUT[ ENTRY ] 中 ， 并 A 
它 也 不 会 在 上 面 说 的 那 条 路 径 中 被 生成 。 我 们 可 以 通过 对 路 径 长 度 的 归纳 来 证 明 x* +y 最 
会 从 这 条 路 径 的 所 有 基本 块 的 IN 和 OUT 值 中 删除 。 

因此 , 当 各 个 IN 和 OUT 值 不 再 改变 的 时 候 ， 图 9-20 中 提 到 的 迭代 算法 给 出 的 解 将 只 包 
含 真正 的 可 用 表达 式 。 














! 练习 9. 2.9: 证 明 有 关 算 法 9.17 的 下 列 特 性 : 

1) 各 个 IN A OUT 的 值 决 不 会 增长 。 也 就 是 说 ,这 些 集合 在 后 来 的 取 值 总 是 它们 前 面 取 值 
的 子 集 (不 一 定 是 真子 集 )。 

2) 如 果 表 达 式 e 从 IN[ B] BK OUT 3 中 被 删除 , 那么 必然 相应 地 存在 一 条 从 流 图 入 口 到 达 B 
的 开始 处 或 结尾 处 的 路 径 , 要 么 e 在 这 条 路 径 上 从 没有 被 计算 过 , 要 么 在 最 后 一 次 对 e 计算 之 后 ， 
e 的 某 个 参数 被 重新 定 值 了 。 

3) 如 果 表 达 式 最 终 保留 在 IN[B] 或 OUT[8] 中 , 那么 相应 地 从 流 图 人 口 到 基本 块 8 开始 处 
或 结尾 处 的 所 有 路 径 中 ，e 都 被 计算 , 且 在 最 后 一 次 计算 e 之 后 , e 的 参数 都 没有 被 重新 定 值 。 

| 练习 9. 2.10: 细心 的 读者 可 能 注意 到 在 算法 9. 11 中 , 我 们 可 以 把 各 个 基本 块 8 的 gen, 初始 
化 为 OUT, B], 这 样 可 以 减少 一 些 运 行 时 间 。 类 似 地 , 我 们 还 可 以 在 算法 9.14 中 把 uses 初始 化 为 
IN[ B]。 我 们 没有 这 么 做 的 原因 是 为 了 用 统一 的 方法 来 处 理 这 个 主题 。 我 们 将 在 算法 9. 25 中 再 次 
看 到 这 一 点 。 但 是 , 可 以 在 算法 9. 17 中 把 e_geng 初始 化 为 OUTLB] 吗 ? 为 什么 可 以 或 不 可 以 ? 

| 练习 9. 2. 11; 至 今 为 止 , 我 们 的 数据 流 分 析 没 有 利用 条 件 跳 转 的 语义 。 假 设 我 们 在 一 
基本 块 的 结尾 处 找到 一 个 如 下 的 测试 

if (x < 10) goto... 
我 们 如 何 利用 对 测试 表达 式 x < 10 的 理解 来 改进 有 关 到 达 定 值 的 知识 ?请 记 住 , 在 这 里 “改进 ” 
意味 着 我 们 要 消除 某 些 实际 上 永远 不 可 能 达到 某 个 程序 点 的 到 达 定 值 。 


9.3 数据 流 分 析 基 础 


我 们 已 经 给 出 了 几 个 数据 流 抽 象 的 有 用 的 例子 , 现在 我 们 以 整体 的 方式 抽象 地 研究 数据 流 
模式 族 。 我 们 将 正式 回答 下 列 有 关 数 据 流 算法 的 基本 问题 : 

1) 数据 流 分 析 中 用 到 的 迭代 算法 在 什么 情况 下 是 正确 的 ? 

2) 通过 和 迭代 算法 得 到 的 解 有 多 精确 ? 

3) 迭代 算法 收敛 吗 ? 

4) 这 些 方程 组 的 解 的 含义 是 什么 ? 

在 9.2 节 中 我 们 描述 到 达 定 值 问题 的 时 候 已 经 非 正 式 地 回答 了 上 面 的 问题 。 对 于 后 来 的 几 
个 数据 流 问 题 , 我 们 并 没有 从 头 回 答 同 样 的 提问 , 我 们 依靠 新 闻 题 和 已 讨论 的 问题 之 间 的 相似 之 
处 来 解释 新 问题 。 本 节 中 我 们 试图 做 到 一 劳 永 逸 。 针 对 一 大 类 的 数据 流 问 题 ， 我 们 给 出 一 个 一 
般 性 的 方法 来 严格 地 回答 这 些 问题 。 我 们 首先 确定 数据 流 模 式 的 预期 特性 ,并 证 明 这 些 特性 所 
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列 仿 的 信息 , 包括 正确 性 、 精 确 性 、 daa 法 的 收敛 性 ,以 及 方程 组 解 的 含义 。 这 样 ,在 理解 
老 算 法 或 者 写 新 算 法 的 时 候 ， 我 们 只 需要 给 出 相应 的 数据 流 问题 定义 所 具有 的 特性 ， 就 可 以 立刻 
得 到 对 上 面 各 个 问题 的 回答 。 

对 一 类 模式 给 出 一 个 统一 的 理论 框架 也 有 实践 意义 。 这 个 框架 有 助 于 我 们 在 软件 设计 中 确 
定 求 解 算法 的 可 复 用 组 件 。 因 为 不 需要 对 类 似 的 细节 进行 多 次 重复 编码 ,所 以 不 仅 编 码 的 工作 
量 降低 了 ,编程 错误 也 会 减少 。 

一 个 数据 流 分 析 框 架 (D, V, A, 下 ) 由 下 列 元 素 组 成 

1) 一 个 数据 流 方向 D, 它 的 取 值 包括 FORWARD( 前 向 ) 或 BACKWARD (XI ) 。 

2) 一 个 半 格 (定义 请 见 9.3.1 4), 它 包 括 值 集 了 和 一 个 交汇 运算 人 。 

3) 一 个 从 V 到 六 的 传递 函数 族 。 这 个 传递 函数 族 中 必须 包括 可 用 于 刻 划 边界 条 件 的 函数 ， 
即 作用 于 任何 数据 流 图 中 的 特殊 结 点 ENTRY 和 EXIT 的 常 值 传递 函数 。 


9.3.1 +R 
半 格 (semilattice) 是 满足 下 列 条 件 的 一 个 集合 了 和 一 个 二 元 交汇 运算 A 。 对 于 了 中 的 所 有 x、 
P All z: 


a o 


1) Ax =a( ZAREE RN). 
2) xAy=yAx( 交 汇 运算 是 可 交换 的 )。 
3) xA(yAz) = (xAy) Az( 交 汇 运算 是 符合 结合 律 的 )。 
半 格 有 一 个 顶 元 素 , RAAT, 使 得 对 于 VV 中 的 所 有 x, TAx=x。 
半 格 可 能 还 有 一 个 底 元 素 , 表示 为 上 ,使 得 对 于 了 中 的 所 有 *， 上 Ax = 上 。 
偏 序 
正如 我 们 将 看 到 的 ,一 个 半 格 的 交汇 运算 定义 了 值 域 上 的 一 个 偏 序 。 假 设 科 为 了 上 的 一 个 
KA, 如 果 对 于 了 上 的 所 有 x*、y 和 z 都 有 : 
1) rs ZMIE AKH) 
2) 如 果 x<y 且 yz<x, 那么 x=y( 该 偏 序 是 反对 称 的 ) 。 
3) 如 果 *<y 且 y 和 z, 那么 x<z( 该 偏 序 是 传递 的 ) 
那么 和 就 是 一 个 偏 序 (partial order) o 
二 元 组 (V，< ) 被 称 为 偏 序 集 ( partially ordered set，poset)。 对 于 一 个 偏 序 集 , 定义 如 下 的 关 
系 < 会 带 来 一 些 方便 : 
a<y HHAH («<y)Bx¥y 
为 半 格 (VYV，A ) 定 义 一 个 如 下 的 偏 序 志 会 有 所 帮助 。 对 于 了 中 的 所 有 x 和 y, 我 们 定义 
x<y 当 目 仅 当 xAy=x 
因为 交汇 运算 人 是 等 宕 的 、 可 交换 的 且 满 足 结合 律 , 上 面 定 义 的 序 和 就 是 自 反 的 、 反 对 称 的 和 传 
递 的 。 下 面 来 说 明 其 中 的 原因 : 
e ARH: 即 对 于 所 有 的 *, £r. AAZ EFREN, 因此 *Ax =x, 
e 反对 称 性 : 即 如 果 *<y Hy<«, 那么 x=y。 在 证 明 中 , rsy 意味 着 x 人 y=x, 而 y<x 意 
味 着 yAx=y。 根据 人 A 的 可 交换 性 , x = (xAy) = (yAx) =y。 
e 传递 性 : 即 如 果 *<y 且 Has <z, MEU F : «<y H ys EKRE xAy=x HyAz=Yo 
那么 使 用 交汇 运算 的 结 得 到 (xAz)=((xAy)Az)=(xA(yAzs)) = (xAy) =% 
因为 已 经 证 明了 x*Az =x， aes x<z, 从 而 证 明了 传递 性 。 
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PISE § 01.9.2 AY EAA C A SEE A IF CHIE. EC ARESE FRAY, 可 交 
换 的 和 可 结合 的 。 对 于 集合 的 并 运算 , 顶 元 素 是 0, 而 底 元 素 是 全 集 U。 这 是 因为 对 于 U 的 任何 
子 集 x 都 有 8 Ux=x 且 UU x= VU。 对 于 集合 的 交汇 运算 , TÆ ULE po FRE V iE 
全 集 U 的 所 有 子 集 的 集合 。 这 个 集合 有 了 时 被 称 为 U RE (power sel), 并 用 2" 表示 。 
对 于 V 中 的 所 有 % 和 y, xUy=x BURA ely. Alb, 并 集运 算 确 定 的 偏 序 为 2 即 集 合 的 包 
含 关系 。 相 应 地 , 集合 的 交集 运算 确定 的 偏 序 是 C， 即 集合 的 被 包含 关系 。 也 就 是 说 , 对 于 由 交 
集运 算 所 确定 的 偏 序 而 言 , 元 素 较 少 的 集合 被 认为 是 比较 小 的 值 ; 但 是 对 于 由 并 集运 算 确定 的 偏 
FMA, 元 素 较 多 的 集合 却 被 认为 是 较 小 的 。 一 个 较 大 的 集合 在 偏 序 中 反而 较 小 是 违反 直觉 的 。 
但 是 根据 前 面 的 定义 , 这 种 情况 是 不 可 避免 的 日。 
9.2 节 中 讨论 过 , 一 个 数据 流 方程 组 通常 有 多 个 解 , 而 (根据 偏 序 关系 所 而 言 ) 最 大 的 解 是 最 
精确 的 。 比 如 , 在 到 达 定 值 问题 中 , 所 有 的 数据 流 方 程 的 解 中 最 精确 的 解 是 具有 最 少 定 值 的 解 。 
这 个 解 对 应 于 由 此 问题 的 交汇 运算 ( 即 并 集运 算 ) 所 定义 的 偏 序 中 的 最 大 元 素 。 在 可 用 表达 式 中 ， 
最 精确 的 解 是 具有 最 多 表达 式 的 解 。 同 样 , 它 是 相对 于 由 交集 运算 ( 即 此 问题 的 交汇 运算 ) 定 义 
的 偏 序 的 最 大 解 。 口 
最 大 下 界 
在 交汇 运算 和 它 确 定 的 偏 序 之 间 还 有 一 个 有 用 的 关系 。 假 设 (V，A ) 是 一 个 半 格 。 域 元 素 4 
Ay 的 最 大 下 界 ( greatest lower bound，glb) 是 一 个 满足 下 列 条 件 的 元 素 g: 
1) gsx 
2) easy, E 
3) WÈ z 是 使 得 z<x A zy 成 立 的 元 素 , 那么 z 和 8g。 
我 们 的 结论 是 , x 和 y 的 交汇 运算 值 就 是 它们 的 唯一 最 大 下 界 。 为 了 说 明 其 中 的 原因 , S 
如 = 艺人 ya 可 以 观察 到 下 列 性 质 : 
e 因为 (xAy)Ax=xAy, 所 以 gg 三 *。 这 个 结论 的 证 明 只 涉及 结合 性 、 可 交换 性 和 等 罕 性 
质 。 也 就 是 ， 
8gAx=((xAy)Ax) = (xA(yAx))=(xA(xAy)) =((xAx) Ay) = (xAy) =g 

。 通过 类 似 的 论证 可 以 得 到 gS yo 

。 假设 z 是 任意 的 满足 z<x 和 z<y 的 元 素 。 已 知 z<g, 因此 除非 z 就 是 g, 否则 它 不 是 x 和 
y 的 一 个 最 大 下 界 。 证 明 如 下 : (2Ag) =(z 人 (xAy))=((zAx)Ay)。 因 为 zx, 我 们 
知道 (z 人 x) =z, 因此 (zAg) = (zAy)。 因 为 z<y, 我 们 知道 z 人 y=z, 因此 zAg=z。 我 
们 已 经 证 明了 zg, 并 且 得 出 结论 g=xAy 是 x 和 y 的 唯一 最 大 下 界 。 
































并 函数 、 最 小 上 界 和 格 

和 一 个 偏 序 集合 中 的 元 素 的 最 大 下 界 操作 对 应 , 我 们 可 以 把 元 素 x 和 y 的 最 小 上 界 (least 
upper bound, lub) 定义 为 满足 下 列 条 件 的 元 素 : xb 且 y<0b, 并 且 对 于 任何 满足 x<z 和 yz 
HIR HA bz TAER, 如果 存 在 最 小 上 界 , 那么 最 多 只 有 一 个 最 小 上 界 。 

在 一 个 真 的 格 中 有 两 个 域 元 素 上 的 运算 :我 们 已 经 看 到 的 交汇 运算 人 ,以 及 记 为 V 的 并 
函数 。 并 (join) 函数 给 出 了 两 个 元 烷 的 最 小 上 界 。 因 此 格 中 的 元 素 总 是 存在 最 小 上 界 。 至 今 











O FHA, 如 果 我 们 把 偏 序 定义 为 三 而 不 是 < ,对 于 并 集 而 言 就 不 会 产生 这 样 的 问题 , 但 是 对 于 交集 而 言 还 是 会 有 这 
样 的 问题 。 
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为 止 我 们 -- 直 讨论 的 是 “ 半 个 " 格 , 即 只 存在 交汇 运算 和 并 函数 之 一 。 也 就 是 说 , 我 们 的 半 格 
是 一 个 交 半 格 (meet semilattice) 。 人 们 也 可 以 讨论 并 半 格 (join semilattice) ， 即 只 有 并 通 数 的 
半 格 。 实 际 上 有 些 程序 分 析 的 文献 就 使 用 并 半 格 的 概念 。 因 为 传统 的 数据 流 文献 讲 的 是 交 半 
格 , 所 以 在 本 书 中 我 们 也 使 用 交 半 格 。 














格 图 
把 域 了 画 成 一 个 格 图 对 我 们 会 有 所 帮助 。 格 图 的 结 点 是 了 的 元 素 , 而 它 的 边 是 向 下 的 ， 即 如 
Ry<x, 那么 从 x Bly 有 一 个 边 。 比 如 , 图 9-22 给 出 了 一 个 到 {} (T) 
达 定 值 数 据 流 模式 的 集合 V。 其 中 有 三 个 定 值 : di d, Ady. a 
因为 半 格 中 的 偏 序 关系 < 是 >, 从 这 三 个 定 值 的 集合 的 子 集 到 
其 所 有 超 集 有 一 个 向 下 的 边 。 因 为 < 是 传递 的 , 如 果 图 中 有 一 om 
geet oes 我 们 可 以 按照 惯例 省 略 从 * 到 y 的 边 。 因 | > 本。 | 
此 , 虽然 在 这 个 例子 中 | di, da, ds1 <1 di], 我 们 并 没有 画 出 lw ,al Peas aya 
这 条 边 ， PEE di, dy} BIRERE, : 
有 一 点 也 很 有 用 , 即 我 们 可 以 从 这 样 的 图 中 读 出 交汇 值 。 Se we 
因为 <Ay 就 是 它们 的 最 大 下 界 , 因此 这 个 值 总 是 最 高 的 、 从 > (dd) (1) 


Fy 都 有 向 下 的 路 径 到 达 的 元 素 zo KM, MS e Eld, | y 图 9-22 定 信 的 子 集 的 格 
是 1d,1, 那么 图 9-22 中 的 z 就 是 |di ,da | 。 这 是 正确 的 ， 因 为 
这 里 的 交汇 运算 是 并 集运 算 。 项 元 素 将 出 现在 格 图 的 顶部 ,也 就 是 说 , 从 T 到 图 中 的 每 个 元 素 都 有 
一 条 向 下 的 路 径 。 类 似 地 , 底 元 素 将 出 现在 图 的 底部 ,从 每 个 元 素 都 有 一 条 边 到 达 | 。 

乘积 格 

图 9-22 中 只 涉及 了 三 个 定 值 , 而 一 个 典型 程序 的 格 图 可 能 相当 大 。 数 据 流 值 的 集合 是 定 什 
OTE, ULI 一 个 程序 中 有 a MER, DCRR a 27 个 元 素 。 但 是 ，- 
个 定 值 是 否 到 达 某 个 程序 点 和 其 他 定 值 的 可 达 性 无 关 。 我 们 因此 可 以 用 "乘积 格 "的 方式 来 表示 
定 值 的 格 日。 这 个 乘积 格 由 各 个 定 值 对 应 的 简单 格 构造 得 到 。 也 就 是 说 , 如 果 程 序 中 只 有 一 个 定 
fd, 那么 相应 的 格 将 只 包括 两 个 元 素 : SH! | ( 它 是 项 元 素 ) IR |d] (CERTZ). 

严格 地 讲 , 我 们 按照 下 面 的 方式 构造 乘积 格 。 假 设 14，A4| 和 {8， 人 | 是 两 个 ( 半 ) 格 。 这 
两 个 格 的 来 积 格 定义 如 下 : 

1) 乘积 格 的 域 是 4 x B. 

2) 乘积 格 的 交汇 运算 和 定义 如 下 : 如 果 (a, b) 和 (a', bO 是 乘积 格 域 中 的 元 素 , WA 











(a, b) Ala, b')=(aNaa’, bA gb') (9. 19) 
乘积 格 的 偏 序 可 以 很 简单 地 用 4 的 偏 序 和 4 和 8 的 偏 序 < p 来 表示 : 
(a, b) <(a', b ETE asaa bepo (9. 20) 


为 了 看 出 为 什么 从 式 (9.19) 可 以 推出 式 (9.20), 请 注意 下 面 的 性 质 : 
(a, b) A(a’, b') =(aA,o’, bAgd') 

我 们 可 能 会 问 在 什么 情况 下 (a 人 4a'，bA gb!) =(a, b)? HHK a Aga’ =a H bA gh! =b HN 

候 这 个 等 式 成 立 。 而 这 两 个 条 件 和 a<4a' 和 5< sb' 是 一 回 事 。 





日” 在 这 里 及 以 后 的 讨论 中 , 我 们 常常 会 把 “ 半 格 "中 的 “ 半 ” 字 去 掉 ， 因为 像 我 们 现在 讨论 的 那些 格 都 有 一 个 并 (或 者 
说 lub) 运 算 符 , 虽然 我 们 不 会 使 用 这 个 运算 符 。 on 
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格 的 乘积 是 一 个 满足 结合 律 的 运算 , 因此 我 们 可 以 证 明 规 则 (9. 19) 和 (9. 20 ) 可 以 被 扩展 到 
任意 多 个 格 。 也 就 是 说 ,如 果 我 们 有 格 (4;，A;) (i=1,2,…, k), 那么 这 上 个 格 按照 这 个 顺序 
的 乘积 的 域 为 4 xd, x… x4k， 其 交汇 运算 定义 为 : 

(aj, aa， ap) A Cbi, ba, Og) = Ca, Ai aaAab +, az Ng by) 
而 偏 序 定义 为 
(ay, a3, °°, ap) 三 (0b1 ,602，,…, bj) HBAR ARW THAN i, a;<b;, 

半 格 的 高 度 | 

通过 人 研究 一 个 数据 流 问 题 中 的 半 格 的 “高 度 ”, 我 们 可 以 知道 一 些 关 于 数据 流 分 析 算 法 收敛 
速度 的 信息 。 偏 序 集 ( YY, <) 的 一 个 上 上升 链 (ascending chain) 是 一 个 满足 Xy LX < Co 的 序列 。 
一 个 半 格 的 高 度 (height) 是 所 有 上 升 链 中 的 < 关系 个 数 的 最 大 值 。 也 就 是 说 ,高 度 比 链 中 的 元 素 
个 数 少 一 。 比 如 , 一 个 有 个 定 值 的 程序 的 到 达 定 值 半 格 的 高 度 是 n。 

如 果 一 个 半 格 具有 有 穷 的 高 度 , 就 可 以 比较 容易 地 证 明 相 应 的 迭代 数据 流 算法 的 收敛 性 。 
显然 , 一 个 由 有 穷 值 集 组 成 的 格 具 有 有 穷 的 高 度 ; 一 个 具有 无 穷 多 个 值 的 格 也 可 能 具有 有 穷 的 高 
度 。 在 常量 传播 算法 中 使 用 的 格 就 是 一 个 这 样 的 例子 , 我 们 将 在 9.4 节 中 详细 地 说 明 这 个 例子 。 
9.3.2 传递 函数 : 

一 个 数据 流 框 架 中 的 传递 函数 族 F: VV 具有 下 列 性 质 .: 

1) 已 有 一 个 单元 函数 1, ERT V PENA x, Ix) =x. 

2) 下 对 函数 组 全 运算 封闭 。 也 就 是 说 , 对 于 下 中 的 任意 函数 /和 g, 定义 为 h(x) =g(f(x)) 
的 函数 及 也 在 中 。 

DOEI 在 到 达 定 值 中 , FATAL, BP gen 和 kil 都 是 空 集 的 传递 函数 。 对 函数 组 合 的 圭 
闭 性 实际 上 已 经 在 9.2.4 节 中 得 到 证 明 , 我 们 在 这 里 简单 地 重复 一 下 证 明 过 程 。 假 设 我 们 具有 两 
个 函数 





fi (x) = Cl U(x-K Al fy (x) =G6,U(«- Ky) 
那么 
fof, (#)) =G,U((6, U (%-K,)) - Ky) 
根据 代数 规则 ,上 式 的 右 部 和 下 式 等 价 : 
(6,U(G, 一 天 2 ) ) U(x -(K, UK,)) 
如 果 我 们 令 开 =R UK, G=G,U(6,-Ky), 我 们 就 证 明了 fi AA 的 组 合 f(x) =GU(x- 
K) 的 形式 表明 它 是 到 的 成 员 。 如 果 我 们 考虑 可 用 表达 式 的 问题 ,上面 用 于 到 达 定 值 的 证 明 也 同 








样 可 以 证 明天 具有 单元 函数 并 且 对 函数 组 合 运算 封闭 。 口 
单调 的 框架 


要 使 得 数据 流 分 析 问题 的 迭代 算法 能 够 完成 任务 ,我 们 还 要 求 数据 流 框架 再 满足 一 个 条 件 。 
对 于 一 个 框架 , 如 果 框架 中 的 所 有 传递 函数 都 是 单调 的 , 那么 我 们 就 说 这 个 框架 是 单调 的 。F 中 
的 传递 函数 /是 单调 函数 的 条 件 是 对 于 域 了 中 的 任意 两 个 元 素 , 如 果 第 一 个 元 素 大 于 第 二 个 元 
素 , 那么 /作用 于 第 一 个 元 素 的 结果 也 大 于 它 作用 于 第 二 元 素 所 得 到 的 结果 。 


正式 的 定义 如 下 , 一 个 数据 流 框架 (了 , F, VY， 人 ) 是 单调 的 (monotone) ， 如 果 
WFAN VPA xs Aly AR FRA, x<y 蕴含 f(x) <f(y) (9. 22) 
单调 性 可 以 被 等 价 地 定义 为 
对 于 所 有 的 VF 中 的 x 和 y AR ERS, Aa Ny) f(x) ARY) (9. 23) 


式 (9. 23) 说 明 , 如 果 我 们 对 两 个 值 应 用 交汇 运算 再 应 用 函数 记 那么 得 到 的 结果 绝对 不 会 大 


400 BIS 





于 首先 将 /分 别 应 用 于 两 个 值 , 然后 再 对 结果 应 用 交汇 运算 而 得 到 的 值 。 这 两 个 关于 单调 的 定义 
看 起 来 很 不 相同 ,它们 各 有 各 的 用 处 。 我 们 会 发 现 这 两 个 定义 分 别 适用 于 不 同 的 环境 。 稍 后 我 
们 将 给 出 一 个 简略 的 证 明 ,， 表明 它们 确实 是 等 价 的 。 
我 们 将 首先 假设 式 (9. 22) 成 立 并 证 明 式 (9.23) 成 立 。 因 为 <Ay 是 x* 和 y 的 最 大 下 界 , 我 们 知道 
xAy<x AxAysy 
因此 由 式 (9. 22) BT Al: 
f(xAy) Sf) HANY) </y) 
因为 x) f(y) 是 f(x) 和 f(y) 的 最 大 下 界 , 我 们 证 明了 (9.23) 。 
反 过 来 , 我 们 假设 式 (9.23 ) 成 立 并 证 明 式 (9. 22) 。 我 们 假设 *<y 并 使 用 式 (9.23) 来 得 到 
f(x) <f(Y) 的 结论 , 从 而 证 明 式 (9.22)。 式 (9. 23 ) 告 诉 我 们 
Kany) <f(x) Af) 
但 是 因为 我 们 已 经 假设 了 x<y, 根据 定义 有 xAy=x。 因 此 , 式 (9. 23) 表 明 
f(x) Sfx) Af) 
因为 1x) Af(y) 是 f(x) 和 f(y) 的 最 大 下 界 , 我 们 得 到 f(x) 和 f(y) <f Cy) 。 这 样 
f(x) <f(x) Af(y) <f(y) 
因此 式 (9. 23) 草 含 式 (9. 22)。 
可 分 配 的 框架 
数据 流 分 析 框架 经 常会 遵守 一 个 比 式 (9. 23) 更 强 的 条 件 , 我 们 把 这 个 条 件 称 为 可 分 配 条 件 
(distributivity condition) ， 即 对 于 了 中 的 所 有 xx Ay 以 及 天 中 的 所 有 六 有 
flay) =K) Af) 
当然 , 如 果 a =b, 那么 根据 等 宕 性 有 auA8 = ao, 因此 op。 这 样 , 可 分 配 性 蕴含 了 单调 性 , 但 是 
反 过 来 并 不 成 立 。 
Pee 令 ， 和 :为 到 达 定 值 框架 下 的 定 值 集合 。 令 /是 一 个 定义 为 Kxz) = CU(x -KHK 
数 , 其 中 CG 和 为 某 个 定 值 的 集合 。 通 过 检验 下 面 的 等 式 
GU((yUz) -K) =(GU(y-K)) U(GU(z-K)) 
我 们 就 可 以 证 明 到 达 定 值 的 框架 满足 可 分 配 性 条 件 。 
虽然 上 面 的 等 式 看 起 来 很 难 , 但 我 们 可 以 首先 考虑 在 6 中 的 那些 定 值 。 这 些 定 值 一 定 都 在 
上 面 等 式 的 左 部 和 右 部 所 定义 的 两 个 集合 中 。 因 此 我 们 只 需要 考虑 不 在 6 中 的 定 值 的 集合 。 在 
这 种 情况 下 , 我 们 可 以 把 G 从 所 有 的 地 方 删 除 , 并 验证 等 式 
(yUz) —K=(y~-K) U(z~K) 
通过 Venn 图 就 可 以 很 容易 地 验证 这 个 等 式 。 口 
9.3.3 通用 框架 的 迭代 算法 
我 们 可 以 对 算法 9. 11 进行 推广 , 使 之 能 够 处 理 各 种 数据 流 问 题 。 
通用 数据 流 框架 的 迭代 解法 。 
输入 : 一 个 由 下 列 部 分 组 成 的 数据 流 框架 : 
1) 一 个 数据 流 图 , 它 有 两 个 被 特别 标记 为 ENTRY 和 EXIT 的 结 点 。 
2) 数据 流 的 方向 D。 
3) 一 个 值 集 V。 
4) 一 个 交汇 运算 入 。 
5) 一 个 函数 的 集合 ,其 中 .fs 表示 基本 块 B 的 传递 函数 。 
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6) 了 中 的 一 个 常量 值 wfwray 或 者 pgxmrs。 它 们 分 别 表示 前 向 和 逆向 框架 的 边界 条 件 。 

输出 : 上 述 数 据 流 图 中 各 个 基本 块 8 的 IN[8] 和 0UT[B] 的 值 。 这 些 值 在 中 。 

方法 : 解决 前 向 和 逆向 数据 流 问题 的 算法 分 别 显示 在 图 9-23a 和 图 9-23b 中 。 和 9.2 节 中 的 各 
个 数据 流 迭 代 算法 类 似 , 我 们 通过 不 断 近似 逼近 的 方式 来 计算 各 个 基本 块 的 次 值 和 OUT 值 。 口 























1) OUT[ENTRY] = wanrnyi 1) IN(EXIT] = vex; 
2) for ( 除 ENTRY 之 外 的 每 个 基本 块 B) ouT[B] = T; 2) for ( 除 EXIT 之 外 的 每 个 林 本 块 B) IN[B] = T; 
3) while ( 某 个 OUuT 值 发 生 了 改变 ) 3) while ( 某 个 IN 值 发 生 了 改变 ) 
4) for (BR ENTRY 之 外 的 每 个 基本 抉 妃 ) { 4) for ( 除 EXIT 之 外 的 每 个 基本 块 B) { 
5) IN[B] = A py py .rim OUTIP]: 5) OUT[B] = A sage man NISI 
6) a UONE 6) IN[B] = fe(ouT[B]); 

a) RI RAR Htc] AG PC b) 逆向 数据 流 问 题 的 迭代 算法 


图 9-23 ”数据 流 问题 迭代 算法 的 前 向 和 逆向 的 版 本 


也 可 以 改写 算法 9. 25, 使 得 它 把 实现 交汇 运算 的 函数 作为 一 个 参数 , 同时 也 把 实 - 现 各 基本 块 
的 传递 函数 的 函数 作为 参数 。 流 图 本 身 和 边界 值 也 都 作为 参数 。 使 用 这 种 方法 ,编译 器 的 实现 
”者 就 可 以 避免 为 编译 器 优化 阶段 所 使 用 的 每 个 数据 流 框 架 都 从 头 编写 基本 迭代 算法 的 代码 。 

我 们 可 以 使 用 至 今 为 止 讨论 的 抽象 框架 来 证 明 该 迭代 算法 的 一 组 有 用 的 性 质 : 

1) 如 果 算 法 9. 25 收敛 ,其 结果 就 是 数据 流 方程 组 的 一 个 解 。 

2) 如 果 框 架 是 单调 的 , 那么 找到 的 解 就 是 数据 流 方程 组 的 最 大 不 动 点 ( Maximum FixedPoint, 
MFP) 。 一 个 最 大 不 动 点 是 一 个 具有 下 面 性 质 的 解 : 在 任何 其 他 解 中 , IN[8] 和 OUT[B] 的 值 和 
MFP 中 对 应 的 值 之 间 具 有 志 关 系 。 

3) 如 果 框 架 的 半 格 是 单调 的 , 是 高 度 有 穷 , 那么 这 个 迭代 算法 必定 收敛 。 

论证 这 些 论点 时 , 我 们 首先 假设 框架 是 前 向 的 。 对 于 逆向 框架 的 论证 实质 上 是 一 样 的 。 第 
一 个 性 质 很 容易 证 明 。 如 果 在 while 循环 结束 的 时 候 方程 组 没有 被 满足 , 那么 各 个 OUT 值 (对 前 
向 框架 ) 或 IN 值 (对 疼 向 框架 ) 中 至 少 有 一 个 值 改变 了 , 我 们 必须 再 次 运行 该 循环 。 

- 为 了 证 明 第 二 个 性 质 , 我 们 首先 证 明 , 在 运行 算法 迭代 时 任意 的 基本 块 B 的 IN[8] 利 

0UT[ 8] 所 取 的 值 只 能 (相对 于 格 中 的 所 关系 而 言 ) 下降。 这 个 性 质 可 以 通过 归纳 方法 证 明 。 
” ”归纳 基础 : 归纳 的 基础 步骤 是 证 明 INB] OUT[B8] 的 值 在 第 一 个 迁 代 之 后 不 大 于 初始 值 。 
这 个 论断 的 正确 性 是 显而易见 的 , 因为 所 有 不 等 于 ENTRY 的 基本 块 B 的 IN[B] 和 OUT[8B] 都 被 
初始 化 为 T。 

归纳 步骤 : 假设 经 过 次 迭代 之 后 , 那些 值 都 不 大 于 第 (上 -1) 次 迭代 后 的 值 , 我 们 要 证 明 第 
5+1 次 迭代 和 第 天 次 选 代 相 比 同 样 如 些 。 图 9-23a 的 第 5 行 是 : 

IN[B]= 人 ooTIP] 


PISBKI— PTR 
我 们 用 IN[B] #1 OUT[ B]! 标记 IN[8] 和 OUT[8] 在 第 i 次 迭代 之 后 的 值 。 假设 OUT[P]*< 
OUT[ P], 由 交汇 运算 的 性 质 可 知 IN[8]*+! <IN[B8]*。 接 下 来 , 第 (6) 行 说 
OUT[ B] =f, (IN[B]) 
因为 IN[ B]*+!1<IN[B8]*, 由 单调 性 可 知 OUT[ B]**! <OUT[B]*。 
请 注意 , 每 一 个 IN[B8] 和 OUT[B8] 值 的 改变 都 必须 满足 上 述 等 式 。 交 汇 运算 返回 的 是 其 输入 
的 最 大 下 界 , B 且 传 递 函 数 返回 的 值 是 和 基本 块 本 身 及 它 的 给 定 输入 一 致 的 唯一 解 。 困 此 ,如 果 该 
迭代 算法 终止 ， 甚 结果 值 至 少 和 任何 其 他 解 的 相应 值 一 样 大 。 也 就 是 说 , 算法 9.25 的 结果 是 数 
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据 流 方程 式 的 最 大 不 动 点 。 

最 后 考虑 第 三 点 ， 即 数据 流 框 架 具 有 有 穷 高 度 的 情况 。 因 为 每 个 INLB8] 和 0UT[ Bj] 的 值 在 每 
次 被 改变 时 都 会 减 小 , 而 程序 在 某 一 轮 循环 中 没有 值 改变 时 就 会 停止 , 因此 算法 的 迭代 次 数 不 会 
大 于 框架 高 度 和 流 图 结 点 个 数 的 乘积 , 因此 算法 必然 终止 。 
9.3.4 数据 流 解 的 含义 

现在 我 们 知道 使 用 前 面 的 迭代 算法 得 到 的 解 是 最 大 不 动 点 , 但 从 程序 语义 的 角度 来 看 ,这 个 
结果 又 代表 了 什么 呢 ? 为 了 理解 一 个 数据 流 框 架 (D, F, V, A) 的 解 ,我 们 首先 描述 一 下 一 个 杠 
架 的 理想 解 应 该 是 什么 样子 。 我 们 将 给 出 下 面 的 性 质 ， 即 一 般 情况 下 不 能 得 到 理想 解 , 但 是 算法 
9. 25 保守 地 给 出 了 理想 解 的 近似 值 。 

理想 解 

不 失 一 般 性 , 我 们 假设 现在 感 兴 趣 的 数据 流 框架 是 一 个 前 向 的 数据 流 问 题 。 考 虑 一 个 基本 
块 B 的 人 人口 点 。 求 理想 解 的 第 一 步 是 要 找到 从 程序 人 日 到 达 B 的 开头 的 所 有 可 能 的 执行 路 径 。 
只 有 当 程序 的 某 次 执行 能 够 准确 地 沿 着 某 条 路 径 进 行 , 这 条 路 径 才 被 称 为 “可 能 的 "。 然 后 , 理 
想 的 求解 方法 将 计算 每 个 可 能 路 径 尾 端的 数据 流 值 , 并 对 这 些 数据 流 值 应 用 交汇 运算 得 到 它们 
的 最 大 下 界 。 那 么 , 程序 的 任何 执行 都 不 可 能 在 该 程序 点 上 产生 一 个 更 小 的 数据 流 值 。 另 外 , 这 
个 界限 还 是 紧 致 的 : 根据 流 图 中 到 达 B 的 所 有 可 能 路 径 计算 得 到 的 数据 流 值 的 集合 的 最 大 下 界 
不 可 能 变 得 更 大 。 

我 们 现在 更 为 正式 地 定义 理想 解 。 对 于 一 个 流 图 中 的 每 个 基本 块 8, 令 fs 是 8 的 传递 函数 。 
考虑 任意 从 初始 结 点 ENTRY 到 某 个 基本 块 B 中 的 路 径 l 

P = ENTRY—>B —>B,— B; -1 >B; 
程序 的 路 径 可 能 包含 环 , 因此 一 个 基本 块 可 能 在 路 径 P 中 多 次 出 现 。 EX PHM BH fp W 
fs， fa, ，…, So ,的 函数 组 合 的 结果 。 请 注意 , fp 没有 参与 组 合 运算 , 这 表明 这 条 路 径 只 到 达 B, 
的 开头 ,而 不 是 其 结尾 。 执 行 这 条 路 径 而 创建 的 数据 流 值 就 是 fp(venrny), 其 中 wpNrny 是 代表 初 
始 结 点 ENTRY 的 常 值 传递 函数 的 结果 。 因 此 , 基本 块 B 的 理想 结果 是 
IDEAL[ B] = 人 fp(vENTRY) 


P 是 从 ETNRY 到 8B 的 一 个 可能 路 年 

按照 问题 中 数据 流 框架 的 格 理论 偏 序 关 系 和 , 我 们 有 下 面 的 结论 : 

e 任何 比 IDEAL 更 大 的 答案 都 是 错误 的 。 

o 任何 小 于 或 者 等 于 这 个 理想 值 的 值 都 是 保守 的 ， 即 安全 的 。 

直观 地 讲 , 越 接近 理想 值 的 值 就 越 精 确 。 下 面 说 明 为 什么 方程 的 解 和 理想 值 之 间 必 须 具 有 和 < 
XK. WER, 对 于 任何 基本 块 ， 只 要 忽略 程序 可 能 执行 的 某 些 路 径 就 可 能 得 到 该 基本 块 的 大 于 
IDEAL 的 解 。 但 是 , 如 果 我 们 基于 这 样 的 较 大 解 来 改进 代码 , 就 不 能 保证 这 些 被 忽略 的 路 径 中 一 
定 不 会 有 某 些 执行 效果 使 得 我 们 的 代码 改进 不 正确 。 反 过 来 , 任何 小 于 IDEAL 的 值 都 可 以 被 看 
作 是 包含 了 某 些 不 必要 的 路 径 , 它们 可 能 是 流 图 中 不 存在 的 路 径 , 也 可 能 流 图 中 存在 此 路 径 但 程 
序 却 不 会 按 这 条 路 径 执 行 。 这 些 较 小 的 解 将 只 允许 进行 对 程序 的 所 有 可 能 执行 都 正确 的 转换 
但 是 它们 会 禁止 IDEAL 值 原 本 允许 的 某 些 转换 。 i 

基于 路 径 交 汇 运 算 的 解 

但 是 正如 9.1 节 中 所 讨论 的 , 寻找 所 有 可 能 的 执行 路 径 是 一 个 不 可 判定 问题 。 因 此 , 我 们 必 : 











O 请 注意 , 在 一 个 前 向 的 问题 中 , 我 们 希望 IN[ 83] 的 值 等 于 IDEALL8] 的 值 。 我 们 没有 在 这 里 讨论 逆向 的 问题 。 Ë 
逆向 的 问题 中 , 我 们 把 IDEALIB] 定 义 为 OUT[ 8] 的 理想 值 。 
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须 使 用 近似 方法 。 在 数据 流 抽 象 中 , 假设 流 图 中 的 每 条 路 径 都 可 能 被 执行 。 因 此 , 我 们 可 以 用 如 
下 方法 定义 B 的 基于 路 答 交 汇 运 算 的 解 。 
MORI al 7 re a ( SENTRY ) 

请 注意 ， 和 前 面 讨论 IDEAL 时 一 样 ,， MOP[B] 解 给 出 的 是 前 向 数据 流 框架 中 IN[B] 的 值 。 如 果 我 
们 要 考虑 反 向 数据 流 框架 , 那么 我 们 会 把 MOP[ B] 当 作 OUT[ B) 的 值 。 

在 MOP 解 中 考虑 的 路 径 是 所 有 可 能 被 执行 路 径 的 超 集 。 因 此 ，MOP 解 中 交汇 运算 的 输入 不 
仅 包括 所 有 可 执行 路 径 的 数据 流 值 , 还 包括 了 一 些 和 不 可 能 执行 路 径 相 关 的 数据 流 值 。 把 理想 
解 和 一 些 其 他 的 值 进行 交汇 运算 不 可 能 创造 出 一 个 大 于 理想 值 的 解 。 因 此 , 对 所 有 的 B, 我们 有 


最 大 不 动 点 和 MOP 解 

请 注意 , 如 果 流 图 包含 环 , 那么 在 MOP 解 中 需要 考虑 的 路 径 数量 仍然 是 无 界 的。 因此 , 不 能 
直接 由 MOP 的 定义 得 到 算法 。 当 然 , 迄 代 算 法 也 不 是 先 找到 所 有 到 达 一 个 基本 块 的 路 径 ， 然后 
再 应 用 交汇 运算 的 , 而 是 采用 如 下 方法 : 

1) 这 个 迭代 算法 访问 各 个 基本 块 , 其 访问 的 顺序 并 不 一 定 是 执行 的 顺序 。 

2) 在 每 个 路 径 交 汇 点 , 算法 对 当前 已 经 得 到 的 数据 流 值 应 用 交汇 运算 。 其 中 一 部 分 被 使 用 
的 值 可 能 是 在 初始 化 过 程 中 人 为 加 入 的 , 并 不 表示 从 程序 开始 的 执行 结果 。 

IA, MOP 解 和 算法 9.25 产生 的 MEP 解 之 间 有 何 关 系 呢 ? 
































”我 们 首先 讨论 一 下 访问 结 点 的 顺序 。 在 一 次 迭代 中 , 我们 可 能 在 访问 一 个 结 点 的 前 驱 之 前 
就 访问 这 个 结 点 。 如 果 其 前 驱 为 ENTRY 结 点 ，OUT[ ENTRY ] 已 被 初始 化 为 正确 的 常量 值 。 其 他 
结 点 的 OUT 值 被 初始 化 为 顶 元 素 T,， 这 个 值 不 小 于 最 后 的 结 ae 
果 。 由 单调 性 可 知 , 使 用 T 作 为 输入 得 到 的 结果 不 小 于 期 户 
解 。 从 某 种 意义 上 说 , 我们 把 T 当 作 表 示 不 包含 任何 信息 B, B, 
的 值 。 | 
提前 应 用 交汇 运算 的 效果 是 什么 呢 ? 考虑 图 9.24 中 的 简 So 
” 单 例子 , 并 假设 我 们 对 IN[ By] 的 值 感 兴趣 。 根 据 MOP 的 Bs 
MOP[ By] = ( (fp, ofa, ) A Fa, ofa, )) (veENTRY) B, 
在 迁 代 算法 中 , WERNHER B, By. By, By 的 顺序 访问 结 
点 ,那么 图 9-24 ”说明 提 前 应 用 路 径 
IN[ By] =f, ( (fa, (vewrny) Afe, (Penty) ) ) 交汇 运算 的 效果 的 流 图 
在 MOP 的 定义 中 最 后 才 应 用 交汇 运算 , 而 迭代 算法 则 提早 使 用 这 个 函数 。 只 有 当 数 据 流 框 


架 为 可 分 配 时 得 到 的 解 才 是 相同 的 。 如 果 一 个 数据 流 框 架 单 调 但 不 可 分 配 , 我们 仍然 有 IN[ Bs | 
夺 MOP[ B4 ] 。 回 忆 一 下 ,总 的 来 说 , 如 果 对 所 有 的 基本 块 B 都 有 IN[B] <IDEAL[B], 那么 这 个 
解 就 是 安全 的 (保守 的 )。 这 个 解 当然 是 安全 的 , 因为 MOPLB] <IDEAL[B], 

我 们 现在 简略 说 明 一 下 为 什么 迭代 算法 提供 的 MFP 解 总 是 安全 的 。 对 i 进行 简单 的 归纳 就 
可 以 表明 在 第 i 次 迭代 之 后 得 到 的 值 小 于 或 等 于 对 所 有 长 度 小 于 等 于 i 的 路 径 进行 交汇 运算 而 得 
到 的 值 。 但 是 当 和 迭代 算法 终 目的 时 候 , 它 得 到 的 值 和 再 进行 任意 多 次 迭代 所 得 到 的 值 相 同 。 因 . 
此 其 结果 不 会 大 于 MOP 解 。 因 为 MOP<IDEAL MFP <MOP, 我 们 知道 MFP <IDEAL, 因此 由 
迭代 算法 提供 的 MFP 解 是 安全 的 。 
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9.3.5 9.3 BHA 

练习 9. 3. 1: AEAEE R. JE RAE T ed (i =1, 2,3), 
得 到 的 格 图 和 图 9-22 中 的 格 图 有 什么 关系 ? 

! 练习 9. 3.2; 在 9.3.3 节 中 , 我 们 说 如 果 框 架 具 有 有 限 的 高 度 , 那么 迭代 算法 收敛 。 这 里 
给 出 一 个 框架 没有 有 限 高 度 且 迭代 算法 也 不 收敛 的 例子 。 令 值 集 V 是非 负 实 数 , 令 交 汇 运 算 为 
取 最 小 值 运算 。 有 三 个 传递 函数 ; 

1) 单元 函数 .六 (zx) = Xo 

2)“ 半 ”函数 , BIKR fy (a) =x/2。 

3) “—" PRR, EDR fo(x) =1。 

传递 印 数 的 集合 玉 是 这 三 个 函数 以 及 它们 按照 各 种 可 能 方式 组 合 得 到 的 冰 数 。 

1) 描述 函数 集 Fo 

2) 这 个 框架 的 < 关系 是 什么 ? 

3) 给 出 一 个 流 图 并 在 流 图 的 各 个 结 点 上 赋予 传递 亢 数 ,使 得 算法 9. 25 对 这 个 流 图 不 收敛 。 

4) 这 个 框架 是 单调 的 吗 ? 它 是 可 分 配 的 吧 ? 

| 练习 9. 3. 3: 我 们 说 如 果 框 架 单 调 且 具有 有 限 高 度 , 那么 算法 9. 25 收敛 。 这 里 给 出 一 个 
框架 的 例子 。 它 说 明 单 调 性 是 很 重要 ， 有 穷 高 度 不 足以 保证 算法 收敛 。 这 个 框架 的 域 了 是 上 EL， 
2}, 交汇 运算 是 min, 而 函数 集 忆 只 有 单元 函数 ( 方 ) 和 ”" 某 换 ”函数 (和 (xz) =3 -«), 它 的 功能 是 使 
得 值 在 1 和 2 之 间 互 换 。 

1) 说 明 这 个 框架 具有 有 限 高 度 , 但 是 不 单调 。 

2) 给 出 一 个 流 图 的 例子 , 并 给 每 个 结 点 赋予 一 个 传递 函数 , 使 得 算法 9.25 对 这 个 流 图 不 
收敛 。 

| 练习 9. 3.4: 令 MOP;[B] 为 所 有 从 程序 入 口 结 点 到 达 基 本 块 8 的 长 度 不 大 于 i 的 路 径 的 交 
汇 运 算 结 果 值 。 证 明 在 算法 9. 25 壕 代 i 次 之 后 , IN[B] < MOP,[8]。 辐 时 证 明 , 作为 上 面 结论 
的 推论 , 如 果 算 法 9. 25 WN, 它 必 然 收 敛 于 某 个 和 MOP 解 具 有 到 关系 的 值 。 

| 练习 9. 3.5: 假设 一 个 框架 的 传递 函数 集合 下 具有 gen-kill 形式 。 也 就 是 说 , MV 是 某 个 
RSW, 而 f(x) =CGU(z -天 ) ,其 中 C 和 天 是 两 个 集合 。 证 明 如 果 交 汇 运算 是 并 集运 算 或 交 
集运 算 , 框架 都 是 可 分 配 的 。 


9.4 常量 传播 


FE 9. 2 节 中 讨论 的 所 有 数据 流 模式 实际 上 都 是 具有 有 限 高 度 的 可 分 配 框架 的 简单 例子 。 这 
样 ， 和 迭代 算法 9. 25 的 前 向 或 逆向 版 本 可 以 用 来 解决 这 些 问题 , 并 求 出 每 个 问题 的 MOP 解 。 在 本 
TE, 我 们 将 深入 研究 一 个 具有 更 多 有 趣 性 质 的 有 用 的 数据 流 框架 。 

回忆 一 下 常量 传播 (或 者 说 “常量 折 妆 " ) ， 即 把 那些 在 每 次 运行 时 总 是 得 到 相同 常量 值 的 表 
达 式 蔡 换 为 该 常量 值 。 下 面 描述 的 常量 传播 框架 和 至 今 已 经 讨论 的 数据 流 问题 都 有 所 不 同 。 不 
同 之 处 在 于 : - l 

1) 它 的 可 能 数据 流 值 的 集合 是 无 界 的 。 即 使 对 于 一 个 确定 的 流 图 也 是 如 此 。 

2) 它 不 是 可 分 配 的 。 

常量 传播 是 一 个 前 向 数据 流 问 题 。 表 示 此 问题 数据 流 值 的 半 格 和 问题 的 传递 函数 族 存 下 面 
给 出 。 

9. 4.1 常量 传播 框架 的 数据 流 值 
这 个 问题 的 数据 流 值 的 集合 是 一 个 乘积 格 ， 其 中 每 个 分 量 对 应 于 程序 中 的 一 个 变量 。 单 个 
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ARLE AIH ALP SUCH LAK 

1) 所 有 符合 该 变量 的 类 型 的 常量 值 。 

被 映射 到 值 NAC。 这 个 变量 被 映射 到 NAC 值 的 原因 可 能 是 它 被 赋予 了 一 个 输入 变量 的 值 ， 或 者 
它 从 一 个 不 具 常 量 值 的 变量 中 获得 值 , 也 可 能 是 在 到 达 同 一 程序 点 的 不 同 路 径 上 被 赋予 不 同 的 
常量 值 。 

3) {É UNDEF, 代表 未 定义 。 如 果 还 不 能 确定 任何 有 关 这 个 变量 的 信息 , 就 把 它 映射 到 这 个 
值 上 。 原 因 很 可 能 是 还 没有 发 现 有 哪个 对 这 个 变量 的 定 值 能 够 到 达 问 题 中 的 程序 点 。 

请 注意 , NAC 和 和 UNDEF 是 不 同 的 , 实质 上 它们 是 对 立 的 。NAC 说 我 们 已 经 知道 一 个 变量 有 
多 种 定 值 方式 , 因此 我 们 知道 它 不 是 常量 ; UNDEF 是 说 有 关 这 个 变量 我 们 知道 得 非常 少 , 以 至 于 
我 们 根本 不 能 确定 任何 事情 。 

一 个 典型 的 整数 类 型 变量 的 半 格 如 图 9-25 所 示 。 这 里 , 顶 元 素 是 UNDEF, 底 元 素 是 NAC, 
也 就 是 说 , 半 格 的 偏 序 的 最 大 值 是 UNDEF, 最 小 值 是 NAC。 其 他 的 常量 值 是 无 序 的 , 但 是 它们 都 
kk UNDEF 小 而 比 NAC 大。 如 9.3.1 节 所 讨论 的 , 两 个 值 的 交 是 它们 的 最 大 下 界 。 因 此 ,对 于 所 
AKE, 有 

UNDEF Av =v H. NACAv =NAC UNDEF 


WFR AH Ec, 有 2 


cAc=e 
=t -3 -2 -1 0 


1 2. S 
且 给 定 两 个 不 同 的 常量 < 和 ec, ,有 / > 
cy Ac = NAC yg 








这 个 框架 中 的 一 个 数据 流 值 是 从 程序 中 的 各 个 变量 Nac 
到 上 面 的 常量 半 格 中 的 某 个 值 的 映射 。 变 量 "在 一 个 映 。 图 9.25 表示 了 一个 整数 类 型 变量 
Si m PRES mo) o 的 所 有 可 能 " 取 值 ” 的 半 格 


9.4.2 常量 传播 框架 的 交汇 运算 

这 个 数据 流 问 题 的 数据 流 值 的 半 格 就 是 图 9-25 中 所 示 半 格 的 乘积 ， 对 于 每 个 变量 有 一 个 图 
9-25 中 所 示 的 半 格 。 因 此 , mm' 当 且 仅 当 对 于 所 有 的 变量 v 都 有 m(v) <m'(v),. MAU, 
mAm’'=m’" 当 且 仅 当 对 于 所 有 的 变量 v, m(v) Am (v) =m"(v)。 | 
9.4.3 ”常量 传播 框架 的 传递 函数 
| 下 面 我 们 假设 一 个 基本 块 只 包含 一 个 语句 。 包 含 多 个 语句 的 基本 块 的 传递 函数 可 以 通过 
将 各 个 语句 对 应 的 传递 函数 组 合 起 来 而 构造 得 到 。 函 数 集合 下 由 一 组 传递 函数 组 成 , 这 些 传 
递 函 数 接受 的 输入 是 一 个 从 程序 变量 到 常量 格 中 元 素 的 映射 , 而 其 返回 值 则 是 另 一 个 这 样 的 
映射 。 

包含 一 个 单元 函数 , 它 接受 一 个 映射 作为 输入 并 返回 相同 的 映射 。 玉 也 包含 了 对 应 于 EN- 
TRY 结 点 的 常 值 传递 函数 。 这 个 传递 函数 对 于 任意 的 输入 映射 都 返回 上 映射 mo ， 而 对 于 所 有 的 变 
量 v, mo(v) = UNDEF。 央 为 在 据 行 任何 程序 语句 之 前 任何 变量 都 没有 定义 , 因此 这 个 边界 条 件 
是 合理 的 。 

一 般 来 说 , Of, 为 语句 s 的 传递 函数 , IES m 和 m' RAL m =f(m) 的 两 个 数据 流 值 。 我 
们 将 用 m 和 m' 之 间 的 关系 来 描述 /。 

1) WR s 不 是 -一 个 赋值 语句 , 那么 人 就 是 单元 函数 。 

2) WR s 是 一 个 对 变量 x 的 赋值 , 那么 对 于 所 有 变量 vx, m'(v) =m(v); P m (x) HE 
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义 如 下 : 

@ 如 果 语 句 s WERI E 一 个 常量 c, BWA m (x) =e. 

® 如 果 RHS Hany +22, 那么 

m(y) +m(z) ”如 果 m(y) 和 m(z) 都 是 常量 什 
m'(«) =} NAC WR m( 5) RH m(z) HE NAC 
UNDEF 否则 

© 如 果 RHS 是 其 他 表达 式 (比如 -一 个 函数 调用 , 或 者 使 用 指针 的 赋值 ), 那么 m'(x) = NAC。 
9.4.4 ”常量 传递 框架 的 单调 性 

现在 我 们 来 证 明 常 量 传递 框架 是 单调 的 。 首 先 , 我 们 可 以 考虑 一 个 函数 六 对 于 单个 变量 的 
影响 。 除 了 情况 2(b) 之 外 , f, 要 么 没有 改变 m(x) 的 值 , 要 么 把 x 的 映射 值 改 成 一 个 常量 或 者 
NAC。 在 这 些 情 况 下 , 人 无疑 是 单调 的 。 

对 于 情况 2(b) , f 的 影响 如 图 9-26 所 示 。 第 一 列 和 may me, me) | 
第 二 列 代表 y Az 的 可 能 输入 值 ,最 后 一 列表 示 x 的 输出 UNDEF || UNDEF 
值 。 每 列 ( 或 者 每 个 子 列 ) 中 的 值 按照 从 大 到 小 的 方式 排 UNDEF | @ || UNDEF 
” 列 。 为 了 说 明 函 数 的 单调 的 , 我 们 将 检验 下 面 的 性 质 ， 即 Me WE 
对 于 y 的 每 个 可 能 的 输入 值 , x 的 值 不 会 在 z 值 变 小 的 时 
候 变 大 。 比 如 , 在 y 具 有 常量 值 co 的 情况 下 , 当 z 的 值 从 
UNDEF 变 为 c、 再 变 为 NAC Rf, x 的 取 值 相应 地 从 UN- We Be 
DEF 变 为 c +c), 再 到 NAC。 我 们 可 以 对 y 的 所 有 可 能 取 NRG Nae | 
值 重 复 这 个 检验 过 程 。 因 为 对 称 性 , 我 们 甚至 不 需要 对 eee 
第 二 个 运算 分 量 重复 这 个 过 程 就 可 以 得 出 结论 : 当 输入 图 926 x ay tz 的 常量 传播 函数 
变 小 的 时 候 输 出 不 会 变 大 。 

9.4.5 常量 传播 框架 的 不 可 分 配 性 

上 面 定义 的 常量 传播 框架 是 单调 的 , 但 不 是 可 分 配 的 。 也 就 是 说 , 迭代 解 MEP 是 安全 的 ,但 

是 可 能 比 MOP 解 小 。 可 以 用 一 个 例子 来 证 明 这 个 框架 不 是 可 分 配 的 。 
A EA 9-27 的 程序 中 , x 和 y 在 基本 块 B, 中 被 分 别 设置 为 2 和 3, 而 在 基本 块 B, 中 被 
分 别 设置 为 3 和 2。 我 们 知道 , 不 管 按照 哪 条 路 径 执行 , 在 基本 块 B, 的 结尾 处 :的 值 都 是 5。 但 
是 ,上面 的 选 代 算 法 没有 发 现 这 个 事实 。 相 反 地 , ECE B 的 入口 处 应 用 交汇 运算 , 并 把 x 和 7 的 
值 都 设置 为 NAC。 因 为 两 个 NAC 相 加 的 结果 还 是 NAC, 算法 9. 25 在 程序 的 出 口 处 产生 的 输出 是 
z= NAC。 这 个 结果 是 安全 的 , 但 是 不 够 精确 。 算 法 9. 25 不 够 精确 的 原因 是 它 没有 跟踪 x My 之 
间 的 相关 性 : 当 x 是 2 时 y 必然 是 3, 而 当 * 是 3 时 ;必然 是 2。 可 以 使 用 一 个 更 加 复杂 的 框架 来 
跟踪 包含 程序 变量 的 表达 式 之 间 的 相等 关系 ,但 是 这 个 方法 的 代价 要 高 得 多 。 这 个 方法 将 在 练 
39.4.2 中 讨论 。 
理论 上 讲 , 我 们 可 以 把 精确 度 的 丧失 归 因 于 常量 传播 框架 的 不 可 分 配 性 。 令 万 hha 
We he e a 
hilma) Af(mo)) <h Org) ) Af (flmo)) 
体现 了 这 个 框架 的 不 可 分 配 性 。 口 














UNDEF UNDEF 





NAC 





























O 和 往常 一 样 ，+ 表示 一 个 一 般 性 的 运算 符号 ， 而 不 是 只 表示 加 法 。 
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x = 2 x= 3 m m(z) | mu) | m(z) 
y=3 yasi mo UNDEF | UNDEF | UNDEF 
Sao y. filmo) 2 3 UNDEF 
fo(mo) 3 2 UNDEF 
B, filme) A fo(mo) NAC NAC | UNDEF 
2 = xty fa(filmo) A fo(mo)) NAC NAC NAC 

fa(fi(mo)) 2 3 5 

fa( fa(mo)) 3 2 3 

EXIT fa(filmo)) A fa(fetmo)) | Nac | Nac 5 

图 9-27 一 个 说 明 常量 传播 框架 不 可 分 配 的 例子 图 9-28 不 可 分 配 的 传递 函数 的 例子 





9.4.6 ”对 算法 结果 的 解释 

在 迭代 算法 中 使 用 值 UNDEF 有 两 个 且 的 : 初始 化 ENTRY 结 点 , 以 及 在 和 迭代 之 前 对 程序 内 部 
的 点 进行 初始 化 。UNDEF 在 这 两 种 情况 下 的 含义 略 有 不 同 。 第 一 种 情况 是 说 变量 在 程序 开始 执 
行 的 时 候 是 没有 定 值 的 ; 第 二 种 情况 是 表示 因为 在 迭代 过 程 开 始 的 时 候 缺 乏 信 息 , 因 此 我 们 把 解 
近似 估算 为 顶 元 素 UNDEF。 在 迭代 过 程 结 束 后 , 在 ENTRY 结 点 的 出 口 处 各 个 变量 的 值 仍 然 是 
UNDEF， 因 为 OUT[ENTRY] 不 会 改变 。 

UNDEF 值 也 可 能 出 现在 某 些 其 他 的 程序 点 上 。 它 们 的 出 现 意味 着 在 到 达 该 程序 点 的 所 有 路 
径 中 尚未 发 现任 何 对 该 变量 的 定 值 。 请 注意 , 根据 我 们 定义 交汇 运算 的 方式 ， 只 要 有 一 个 对 该 变 
量 定 值 的 路 径 到 达 该 程序 点 , 变量 的 值 就 不 是 UNDEF 了 。 如 果 到 达 一 个 程序 点 的 所 有 定 值 都 有 
同样 的 常量 值 , 那么 即使 该 变量 可 能 在 某 些 路 径 上 没有 被 定 值 , 它 仍然 会 被 当 作 是 常量 。 

如 果 假 设 被 分 析 的 程序 是 正确 的 , 我 们 的 算法 就 可 以 发 现 比 不 做 这 个 假设 时 更 多 的 常量 。 
也 就 是 说 , 我 们 的 算法 会 为 可 能 未 定 值 的 变量 选择 适当 的 值 ,以便 程序 能 够 更 加 高 效 地 执行 。 在 
大 多 数 程 序 设计 语言 中 , 这 种 改变 是 合法 的 , 因为 在 这 些 语言 中 未 定 值 的 变量 可 以 取 任 何 值 。 如 
果 语 言 的 语义 要 求 所 有 未 定 值 的 变量 取 某 个 特定 的 值 , 那么 我 们 就 必须 相应 地 改变 在 这 个 数据 
流 问 题 中 使 用 的 公式 。 如 果 我 们 对 寻找 程序 中 可 能 未 定 值 的 变量 感 兴趣 ， 就 可 以 用 公式 刻画 出 
.一 个 不 同 的 数据 流 分 析 问 题 , 以 提供 相应 的 结果 ( 见 练习 9.4.1)。 
在 图 9-29 中 , 变量 * 在 基本 块 B 和 By I 
的 出 口 处 的 值 分 别 为 10 和 UNDEF, AX UNDEF A 
10=10, x 在 基本 块 B 的 入 口 点 的 值 是 10。 因 此 可 
以 在 使 用 x 的 基本 块 B; 中 把 x 替换 为 常量 10, 从 而 
对 Bs 进行 优化 。 如 果 被 执行 的 路 径 是 Bi +B, 8, 
>B; ,那么 到 达 基 本 块 B; 时 x 的 值 尚 未 定 值 。 因 此 
把 对 x 的 使 用 替换 为 10 看 起 来 是 不 正确 的 。 
且 是 如 果断 言 和 为 真 时 断言 0 不 可 能 为 假 , 那 
么 这 个 执行 路 径 实际 上 不 可 能 出 现 。 虽 然 程序 员 可 
能 知道 这 个 事实 , 但 判定 这 个 事实 已 经 超出 了 任何 
数据 流 分 析 技 术 的 能 力 。 因 此 , 如 果 我 们 假设 程序 
是 正确 的 , 并 且 所 有 变量 在 被 使 用 之 前 都 已 经 定 值 ， 
那么 x 在 基本 块 Bs 开始 处 的 值 只 能 是 10。 如 果 程 ”图 9-29 UNDEF 和 一 个 常量 值 的 交汇 运算 什 
序 一 开始 就 是 不 正确 的 , 那么 选择 10 作为 x 的 值 不 可 能 比 允 许 * 取 随机 值 的 效果 更 糟 。 O 
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9.4.7 9.4 节 的 练习 

! 练习 9.4.1: 假设 我 们 希望 检测 一 个 变量 是 否 有 可 能 在 尚未 初始 化 的 情况 下 到 达 某 个 使 用 
它 的 程序 点 。 你 将 如 何 修改 本 节 中 的 框架 来 检测 这 种 情况 ? 

1! 练习 9.4.2: 在 一 个 有 趣 且 功能 强大 的 数据 流 分 析 框 架 中 , 值 域 了 是 对 表达 式 的 所 有 可 
能 的 分 划 。 两 个 表达 式 在 此 分 划 的 同一 个 等 价 类 中 当 且 仅 当 沿 着 任何 路 径 到 达 问 题 中 的 程序 点 
时 它们 一 定 具有 相同 的 值 。 为 了 避免 列 出 无 穷 多 个 表达 式 , 我 们 可 以 只 列 出 最 少 的 等 值 表 达 式 
对 来 表示 Y。 比 如 , 如果 我 们 执行 语句 


asb 
c=atd 


那么 最 小 的 等 值 表达 式 对 的 集合 是 ja=2, c=a -di。 从 这 些 表 达 式 对 可 以 推出 其 他 的 等 值 关 


1) 适用 于 这 个 框架 的 交汇 运算 是 什么 ? 

2) 给 出 一 个 数据 结构 来 表示 域 中 的 值 , 并 给 出 一 个 算法 来 实现 交汇 运算 。 

3) 适用 于 各 个 语句 的 传递 函数 是 什么 ?解释 一 下 a =) +c 这 样 的 语句 对 于 一 个 表达 式 分 划 
( 即 了 中 的 一 个 值 ) 的 影响 。 

4) 这 个 框架 是 单调 的 吗 ? 是 可 分 配 的 吗 ? 


95 部 分 宛 余 消 除 


在 本 节 中 ,我 们 详细 考虑 如 何 尽量 减少 表达 式 求 值 的 次 数 。 也 就 是 说 , 我 们 希望 考虑 一 个 
流 图 中 所 有 可 能 的 执行 顺序 并 检查 x + 这 样 的 表达 式 被 求 值 的 次 数 。 通 过 移动 各 个 对 x+y 
求 值 的 位 置 ,并 在 必要 时 把 求 值 结果 保存 在 临时 变量 中 , 我 们 常常 可 以 在 很 多 执行 路 径 中 减 
少 这 个 表达 式 被 求 值 的 次 数 , 并 保证 不 增加 任何 路 径 中 的 求 值 次 数 。 请 注意 , 在 流 图 中 x+1 
被 求 值 的 位 置 可 能 增多 ,但 是 相对 来 说 这 一 点 并 不 重要 ， 只 要 对 表达 式 > +y RANK 
少 就 行 了 。 

应 用 本 节 开 发 的 代码 转换 可 以 提高 所 生成 的 代码 的 性 能 。 这 是 因为 ， 正 如 我 们 即将 看 到 的 ， 
在 改进 后 的 代码 中 ,只 有 在 绝对 必要 时 才 会 进行 一 次 运算 。 每 个 优化 编译 器 都 或 多 或 少 地 实现 
了 本 节 中 描述 的 转换 ,虽然 有 些 编译 器 使 用 的 算法 没有 本 节 中 的 算法 那么 "激进 "。 但 是 , 还 有 
另 一 个 动机 促使 我 们 来 讨论 这 个 问题 。 在 流 图 中 寻找 (一 个 或 多 个 ) 适 当 的 位 置 来 对 各 个 表达 式 | 
求 值 需要 进行 四 种 不 同 的 数据 流 分 析 。 因 此 ， 对 "部 分 宛 余 消除 ”( 即 尽量 减少 表达 式 求 值 次 数 的 
技术 ) 的 研究 可 以 帮助 我 们 理解 数据 流 分 析 技术 在 编译 器 中 所 扮演 的 角色 。 

程序 中 的 匈 余 以 多 种 形式 存在 。 如 9.1.4 节 所 讨论 的 ， 它 可 能 以 公共 子 表达 式 的 形式 存在 ， 
即 对 表达 式 的 多 次 求 值 产生 同样 的 结果 。 它 也 可 能 以 循环 不 变 表 达 式 的 方式 存在 ,这 个 表达 式 
在 循环 的 每 次 交代 中 都 得 到 相同 的 值 。 宛 余 也 可 能 是 部 分 性 的 ， 即 只 能 在 部 分 路 径 而 不 是 全 部 
路 径 中 找到 这 个 元 余 。 公 共 子 表达 式 和 循环 不 变 表达 式 可 以 被 看 作 是 部 分 元 余 的 特例 。 因 此 可 
以 设计 一 个 部 分 宛 余 消除 算法 来 消除 不 同 种 类 的 完 余 。 

接 下 来 ,我 们 首先 讨论 宛 余 的 不 同形 式 , 以便 对 这 个 问题 有 直观 的 理解 。 然 后 再 描述 一 般 性 
的 元 余 消除 问题 , 并 在 最 后 给 出 解决 问题 的 算法 。 这 个 算法 很 有 意思 ,因为 它 涉及 多 种 数据 流 问 
题 的 求解 。 这 些 问题 中 既 有 前 向 问题 , 也 有 逆向 问题 。 | 
9.5.1 宛 余 的 来 源 3 

图 9-30 演示 了 宛 余 的 三 种 形式 : 公共 子 表达 式 、 循 环 不 变 表 达 式 和 部 分 宛 余 表达 式 。 该 图 
中 给 出 了 优化 之 前 和 之 后 的 代码 。 
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d = btc | 
a= bte 
‘ | Na 
e = bte t Y d = btc i 
Į UU J| 
pi" ane 
B, t = błc a B, 
2 B, B, 
t= btc | b=7 ; t = bte ste 
a=t t = b+c ast 
| Lda = 七 Beet L L 
ind B 
a) 公共 地 表达 式 b) 循环 不 变 代 码 移动 c) MDa IL ARR j 
图 9-30 各 种 宛 余 的 例子 
全 局 公共 子 表达 式 


在 图 9-30a 中 , 基本 块 B, 中 计算 的 表达 式 +c 是 元 余 的 。 不 管 按照 娜 条 路 径 ， 当 控制 流 到 
达 B, 时 这 个 表达 式 在 之 前 已 经 被 求 过 值 了 。 正 如 我 们 在 这 个 例子 中 观察 到 的 , 在 不 同 的 路 径 上 
表达 式 可 能 取 不 同 的 值 。 我 们 可 以 按照 下 面 的 方法 优化 代码 。 在 基本 块 B, AB, 中 把 b+c 的 计 
算 结果 存放 到 同一 个 临时 变量 ( 比如 说 t) 中 。 然 后 在 基本 抉 B4 中 不 再 重新 计算 这 个 表达 式 ， 而 
是 直接 把 i MERA eo WREX b +e 的 最 后 一 次 求 值 之 后 以 及 基本 块 Ba 之 前 对 “或 有 一 个 
赋值 运算 , 那么 B4 中 的 这 个 表达 式 就 不 再 是 元 余 的 。 

正式 地 讲 , 如 果 按 照 9.2.6 节 的 说 法 , 一 个 表达 式 b +e 在 程序 点 p 上 是 一 个 可 用 表达 式 , 我 
们 就 说 该 表达 式 在 该 点 上 是 (完全 ) 宛 余 的 。 也 就 是 说 , 在 所 有 到 达 p 的 路 径 中 , 表达 式 +e EB 
经 被 求 过 值 , 并 且 在 最 后 一 次 求 值 之 后 变量 5 和 <。 没有 被 重新 定 值 。 后 一 个 条 件 是 必须 的 , 因为 
虽然 从 字面 上 看 表达 式 5+c 在 到 达 点 p 时 已 经 执行 过 了 , 但 在 p 点 计算 得 到 的 5+c 的 值 可 能 是 
不 同 的 ,因为 运算 分 量 可 能 已 经 改变 了 。 








寻找 “深层 ”公共 子 表达 式 
使 用 可 用 表达 式 分 析 来 寻找 元 余 表达 式 时 只 能 够 找 出 字面 上 相同 的 可 用 表达 式 。 比 如 ， 
如 果 两 个 代码 片断 
ti=b+c;a= ti+d; 
All 


t2=btc;e=t2+4; 

之 间 和 。 没 有 被 重新 定 值 , 那么 应 用 公共 子 表达 式 消除 可 以 发 现在 第 一 个 代码 片断 中 的 去 
和 和 第 二 个 代码 片断 中 的 忆 具有 相同 的 值 。 但 是 它 无 法 发 现 a Fle 的 值 也 相同 。 如 果 要 找 出 这 
一 类 “深层 ”的 公共 子 表达 式 , 我 们 可 以 重复 应 用 公共 子 表达 式 消除 技术 ， 直 到 某 一 次 应 用 时 
找 不 到 新 的 公共 子 表达 式 为 止 。 另 一 种 可 能 的 方法 是 使 用 练习 9. 4. 2 中 的 框架 来 找 出 “深层 ” 
公共 子 表 达 式 。 
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循环 不 变 表达 式 

图 9-30b 给 出 了 一 个 循环 不 变 表 达 式 的 例子 。 假 设 变 晤 5 和 < 在 循环 中 没有 被 重新 定 值 , OB 
É b +e 就 是 循环 不 变 的 。 我 们 可 以 把 循环 中 的 所 有 重复 执行 蔡 换 为 循环 外 的 单 次 计算 ， 从 而 优 
化 程序 。 我 们 把 计算 的 结果 赋予 一 个 临时 变量 ,比如 说 ,然后 把 循环 中 的 表达 式 蔡 换 为 :。 当 进 
行 与 此 类 似 的 “代码 移动 ”优化 时 , 我 们 还 需要 考虑 男 一 个 问题 。 我 们 不 应 该 执行 任何 在 未 优化 
时 不 执行 的 指令 。 比 如 ,如 果 有 可 能 在 不 执行 这 个 循环 不 变 指 令 时 就 离开 循环 , 那么 我 们 就 不 应 
该 把 该 指令 移动 到 循环 之 外 。 这 样 做 有 两 个 原因 。 

1) 如 果 该 指令 会 引发 一 个 异常 , 那么 执行 此 指令 可 能 会 抛 出 一 个 原 程序 中 本 来 不 会 发 生 的 

2) 如 果 循 环 提早 退出 ,“ 优 化 "过 的 程序 需要 的 执行 时 间 比 原 程 序 更 多 。 

为 了 保证 while 循环 中 的 循环 不 变 表达 式 可 以 被 优化 ， 编 译 器 通常 把 语句 


while c { 
8; 
} 
表示 成 为 下 面 的 等 价 语句 
if c { 
repea 
S: 


until not c; 


} 
通过 这 种 方法 ,各 个 循环 不 变 表达 式 可 以 直接 放置 在 repeat-until 结构 之 前 。 

在 公共 子 表达 式 消除 中 , 一 个 宛 余 的 表达 式 计算 被 直接 丢弃 。 循 环 不 变 表达 式 消除 和 公共 
子 表达 式 消除 不 同 , 它 要 求 把 循环 内 的 一 个 表达 式 移动 到 循环 之 外 。 因 此 ,这 个 优化 通常 叫做 
“循环 不 变 代码 移动 ”。 循 环 不 变 代码 移动 可 能 需要 重复 进行 ,因为 一 旦 一 个 变量 被 确定 具有 特 
环 不 变 的 值 , 使 用 这 个 变量 的 某 些 表达 式 也 可 能 成 为 循环 不 变 的 。 

部 分 宛 余 表达 式 

一 个 部 分 宛 余 表达 式 的 例子 如 图 9-30c 所 示 。 基 本 块 B, 中 的 表达 式 5 +c 在 路 径 B +B, —B, 
EER, 但 是 在 路 径 B, OB, OB, 上 不 元 余 。 我 们 可 以 在 基本 块 B, 上 放 一 个 计算 b +c 的 指令 , 从 
而 消除 前 一 条 路 径 上 的 宛 余 。 所 有 b + e 的 计算 结果 都 被 写 进 临 时 变量 1， 并且 B, 中 对 b +c 的 计算 
用 :替代 。 因 此 , 和 循环 不 变 代码 移动 一 样 ,部 分 元 余 消 除 需 要 放置 一 些 新 的 表达 式 计算 指令 。 
9.5.2 可 能 消除 所 有 元 余 吗 

可 能 消除 各 条 路 径 上 的 所 有 宛 余 计 算 吗 ?除非 我 们 能 够 通过 创建 新 的 基本 块 来 改变 流 图 ， 
否则 答案 是 “不 能 " 。 
ERR 在 031a 显示 的 例子 中 , 如 果 程 序 的 执行 路 径 是 BBB, MRAR b+。 在 基 
本 块 B4 中 元 余地 计算 。 但 是 ,我 们 不 能 简单 地 把 b+c 的 计算 指令 移动 到 B, 因为 这 么 做 会 在 执 
行路 径 为 有 一 53 一 85 时 多 计算 一 次 b +c. 

我 们 想 做 的 是 在 基本 块 B, 和 B, 之 间 的 边 上 插入 8 +c 的 计算 指令 。 为 了 择 人 这 个 指令 ,我 
们 可 以 创建 一 个 新 的 基本 抉 ,比如 Be, 把 该 指令 放 到 Be 中 ,并 使 得 从 B 开始 的 控制 流 首先 经 过 
Bo 再 到 达 B4 。 这 个 转换 显示 在 图 9-31b 中 。 Oo 

我 们 把 所 有 从 一 个 具有 多 个 后 继 的 结 点 到 达 另 一 个 具有 多 个 前 驱 的 结 点 的 边 定义 为 流 图 的 
关键 边 (critical edge) 。 通 过 在 关键 边 上 引信 新 的 基本 块 , 我 们 总 是 可 以 找到 一 个 基本 块 作为 放 
置 表达 式 的 适当 位 置 。 比 如 在 图 9-31b 中 从 Bs 到 B, 的 边 就 是 关键 边 , 因为 B 具有 两 个 后 继而 
B, 有 两 个 前 驱 。 
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Z| 9-31 BB, 是 一 条 关键 边 


仅 靠 增 加 基本 块 可 能 不 足以 消除 所 有 的 元 余 计 算 。 如 例 9. 29 所 示 , 我 们 要 复制 代码 ,以便 
把 找到 的 具有 元 余 特 性 的 路 径 隔离 开 来 。 
在 图 9-32a 所 示 的 例子 中 , 表达 式 b+c 沿 着 路 径 B1 一 8, 一 Bs 一 Be 被 元 余地 计算 。 我 
们 可 能 愿意 从 这 条 路 径 的 基本 块 86 PIRE b +e 的 元 余 计 算 ， 并 只 在 路 径 Bj B>B, B, Lit 
算 这 个 表达 式 。 但 是 , 源 程序 中 没有 哪个 程序 点 或 边 唯一 地 对 应 于 第 二 条 路 径 。 为 了 创建 这 样 
一 个 程序 点 , 我 们 可 以 复制 一 对 基本 块 B 和 Be 其 中 的 一 对 经 过 B 到 达 ， 而 另 一 对 经 过 B3 到 
ik, 如 图 9-32b 所 示 。 基 本 块 B, 中 的 表达 式 b+c 的 结果 存放 在 上 中 , 并 在 Bs 中 被 移动 到 变量 d 

























































































中 。Bs 是 从 By 到达 的 Be 的 拷贝 。 口 
Tm] F B, 
# < B 
a a = bto) | a ? la = bte re 
cd tea 
B, ge i B, 
Joa. 
B 
3 | acen] s Ais d=t d = bte Be 
a) b) 


图 9-32 ”为 消除 元 余 所 做 的 代码 复制 

因为 路 径 数目 和 程序 中 条 件 分 支 的 数 日 之 间 具 有 指数 关系 ， 所 以 消除 所 有 的 宛 余 表达 式 可 
能 会 大 大 增加 优化 后 代码 的 大 小 。 因 此 我 们 对 所 讨论 的 元 余 消 除 技 术 做 了 一 些 限制 , 即 只 允许 
引入 新 的 基本 块 , 但 是 不 允许 复制 控制 流 图 的 任何 部 分 。 
9.5.3 懒惰 代码 移动 问题 

我 们 期 望 使 用 部 分 元 余 消 除 算 法 进行 优化 而 得 到 的 程序 能 够 具有 下 列 性 质 : 

1) 所 有 不 复制 代码 就 可 以 消除 的 表达 式 元 余 计 算 都 被 消除 掉 了 。 

2) 优化 后 的 程序 不 会 执行 原来 的 程序 中 不 执行 的 任何 计算 。 
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最 后 一 个 性 质 是 很 重要 的 ,因为 找到 的 元 余 表 达 式 的 值 通 常会 在 被 使 用 之 前 一 直 存 放 在 寄 
存 器 中 。 尽 量 靠 后 地 计算 一 个 值 可 以 尽 可 能 地 降低 该 值 的 生命 周期 ， 即 从 该 值 被 定 值 的 时 刻 到 
它 最 后 被 使 用 的 时 刻 之 间 的 时 间 间隔 。 缩 短 生 命 期 也 就 尽 可 能 降低 了 它 使 用 寄存 器 的 时 间 。 我 
们 把 以 尽 可 能 延迟 计算 为 目标 的 部 分 宛 余 消除 优化 称 为 懒惰 代码 移动 。 

为 了 形成 对 于 这 个 问题 的 直观 理解 我 们 首先 讨论 如 何 推导 单条 路 径 上 的 某 个 表达 式 是 否 
具有 部 分 宛 余 性 。 为 方便 起 见 ,我们 在 下 面 的 讨论 中 假设 每 个 语句 都 是 由 它 自己 组 成 的 单 语句 
基本 块 。 

ET 

如 果 在 到 达 基本 块 中 的 所 有 路 径 中 , 一 个 表达 式 。 已 经 被 求 过 值 且 e 的 运算 分 量 在 其 后 没有 
被 重新 定 值 , 那么 8 中 的 。 就 是 宛 余 的 。 令 5 是 那些 使 得 基本 块 B 中 的 e WTA, 并 且 包含 表 
AR e 的 基本 块 的 集合 。 所 有 的 从 $ 中 的 某 个 基本 块 离开 的 边 必然 形成 一 个 审 集 (eut set) 。 如 果 
把 这 些 边 删除 , 那么 基本 块 互 必然 和 程序 的 人 口 点 分 离 。 而 且 , 在 从 $ 中 的 基本 块 到 8 的 路 径 
中 ,，。 的 所 有 运算 分 量 都 没有 被 重新 定 值 。 

部 分 宛 余 

如 果 基 本 块 B 中 的 一 个 表达 式 。 只 是 部 分 宛 余 , 那么 懒惰 代码 移动 算法 将 在 该 流 图 中 放 咎 这 
个 表达 式 的 附加 拷贝 ， 斌 图 使 得 8 中 的 。 成 为 完全 宛 余 的 。 如 果 该 尝试 成 功 ,那么 经 过 优化 后 的 
流 图 也 会 有 一 个 基本 块 的 集合 5, 其 中 的 每 个 基本 块 都 包含 表达 式 。, 并 且 离开 它们 的 边 成 为 程 
序 人 口 和 有 的 制 集 。 和 完全 宛 余 的 情况 一 样 ,e 的 所 有 运算 分 量 都 不 会 在 从 $ 中 的 基本 块 到 8 的 
路 径 上 被 重新 定 值 。 

9.5.4 ”表达 式 的 预期 执行 

对 于 被 插入 的 表达 式 还 有 一 个 约束 , 即 保证 优化 后 的 程序 不 会 执行 额外 的 运算 。 一 个 表达 
式 的 各 个 拷贝 所 放置 的 程序 点 必须 预期 执行 (anticipated) 此 表达 式 。 如 果 从 程序 点 4 出 发 的 所 有 
路 径 最 终 都 会 计算 表达 式 5 +c 的 值 , E b 和 < 在 那 时 的 值 就 是 它们 在 点 p 上 的 值 , 那么 我 们 说 
一 个 表达 式 b +c 在 程序 点 p 上 被 预期 执行 。 

现在 让 我 们 研究 一 下 在 -个 无 环 路 径 B, By 9B, 中 消除 部 分 宛 余 时 应 该 做 些 什么 。 候 
设 表达 式 。 仅 仅 在 B, MB, 中 求 值 , 并 且 。 的 运算 分 量 没有 在 这 条 路 径 的 基本 块 中 被 重新 定 值 。 
假设 有 -一些 边 和 上 面 的 路 径 交汇 , 也 有 一 些 边 从 这 条 路 径 离开 。 我 们 看 到 ，。 在 基本 块 B 的 入口 
处 没有 被 预期 执行 当 且 仅 当 存在 一 个 从 Bj(i<j <n) 发 出 的 边 ， 它 通 向 一 条 不 使 用 8 的 值 的 执行 
路 径 。 因 此 ,对 执行 的 预期 限制 了 一 个 表达 式 最 前 可 以 被 插入 到 哪里 。 

我 们 就 可 以 创建 一 个 包含 了 边 B; 1—8, 的 满足 下 面条 件 的 割 集 。 如 果 。 在 Bi 的 入口 处 可 用 
或 者 被 预期 执行 ,这 个 割 集 就 使 得 。 在 B, HIR MF e TE B, 的 入 口 处 被 预期 执行 却 不 可 用 ， 
我 们 必须 在 这 条 进入 B, 的 边 上 放 一 个 。 的 拷贝。 

我 们 可 以 选择 放置 表达 式 搁 贝 的 位 置 ， 因 为 流 图 中 通常 有 多 个 市 集 满足 所 有 要 求 。 在 上 面 
的 讨论 中 , 表达 式 的 计算 在 进入 我 们 所 关心 的 路 径 的 边 上 引入 。 这 样 做 可 以 在 不 引入 宛 余 计算 
的 情况 下 使 得 表达 式 的 计算 尽量 靠近 对 表达 式 值 的 使 用 。 请 注意 , 这 些 被 引入 的 运算 本身 可 能 
因为 程序 中 同一 个 表达 式 的 其 他 实例 而 体现 出 部 分 完 余 性 。 这 种 部 分 守 余 性 可 以 通过 进一步 上 
移 计算 过 程 而 消除 。 





日 请 注意 ， 对 表达 式 值 的 使 用 和 对 变量 值 的 使 用 不 同 ， 它 实际 上 是 说 该 表达 式 出 现在 某 个 语句 的 右 部 。 一 一 译 者 注 
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总 结 一 下 , 对 表达 式 的 预期 执行 限制 了 一 个 表达 式 可 以 被 放置 得 有 多 靠 前 。 不 能 把 它 放 置 






得 太 靠 前 ， 以 至 于 放置 它 的 地 方 还 没有 预期 执行 它 。 一 个 表达 式 被 放置 得 越 靠 前 ， 能够 删除 的 宛 
余 性 就 越 多 。 在 能 够 消除 同样 的 宛 余 性 的 各 个 解 中 , 最 后 一 个 计算 该 表达 式 的 位 置 可 以 使 存放 
该 表达 式 的 寄存 器 的 生命 周期 最 小 化 。 

9.5.5 懒惰 代码 移动 算法 

Eik, 这 里 的 讨论 给 出 了 一 个 包含 四 个 步骤 的 算法 。 第 一 步 使 用 执行 预期 来 确定 表达 式 可 
以 被 放 在 哪里 ; 第 二 步 寻找 最 前 的 能 够 在 不 复制 代码 且 不 引入 不 必要 计算 的 情况 下 消除 最 多 的 
匈 余 运算 的 割 集 。 这 个 步 又 把 表达 式 的 计算 放 党 在 最 前 的 预期 执行 这 些 表达 式 的 程序 点 上 。 第 
三 步 把 制 集 尽量 向 后 推 , 直到 继续 后 推 会 改变 程序 语义 或 引入 新 的 完 余 为 止 。 最 后 的 第 四 步 很 
简单 , 它 删 除 那 些 给 只 使 用 一 次 的 对 临时 变量 赋值 的 语句 ,达到 清洗 代码 的 目的 。 每 一 个 步 又 都 
伴随 一 个 数据 流 分 析 过 程 : 第 一 个 和 第 四 个 是 逆向 数据 流 问题 ,而 第 二 个 和 第 三 个 是 前 向 的 数据 
流 问 题 。 

算法 概览 ; 

1) 使 用 一 个 逆向 数据 流 分 析 过 程 找到 各 个 程序 点 上 预期 执行 的 所 有 表达 式 。 

2) 第 二 步 把 对 表达 式 的 计算 放置 在 满足 下 面条 件 的 程序 点 上 。 .对 于 每 个 这 样 的 点 , 总 存在 
某 条 路 径 使 得 这 些 点 是 此 路 径 中 第 一 个 预期 执行 这 个 表达 式 的 点 。 我 们 在 一 个 表达 式 最 先 被 预 
期 执行 的 地 方 放置 了 该 表达 式 的 拷贝 之 后 ,假设 有 一 个 这 样 的 程序 点 P,， 所 有 到 达 它 的 原 有 路 径 
中 该 表达 式 都 被 预期 执行 , 那么 现在 该 表达 式 在 程序 点 p 上 可 用 。 可 用 性 可 以 用 一 个 前 向 的 数据 
流 分 析 过 程 完成 。 如 果 我 们 希望 把 这 个 表达 式 放 置 在 尽量 靠 前 的 地 方 , 我 们 只 要 找 出 满足 下 面 
条 件 的 程序 点 就 可 以 了 ; 在 这 些 点 上 此 表达 式 被 预期 执行 但 是 不 可 用 。 

3) 在 一 个 表达 式 最 早 被 预期 执行 的 地 方 对 表达 式 求 值 可 能 会 使 得 表达 式 的 值 在 被 使 用 之 前 
很 久 就 被 生成 了 。 一 个 表达 式 可 被 后 延 到 某 个 程序 点 的 条 件 如 下 : 在 到 达 这 个 点 的 所 有 路 径 上 ， 
这 个 表达 式 在 这 个 程序 点 之 前 已 经 被 预期 执行 , 但 是 还 没有 使 用 这 个 值 。 可 后 延 表 达 式 通过 使 
用 一 个 前 向 的 数据 流 分 析 过 程 找到 。 我 们 把 表达 式 放 置 在 不 能 再 后 延 的 程序 点 上 。 

4) 使 用 一 个 简单 的 逆向 数据 流 分 析 过 程 来 删除 那些 给 程序 中 只 使 用 一 次 的 临时 变量 赋值 的 
语句 。 

预 处 理 步骤 

我 们 现在 给 出 完整 的 懒惰 代码 移动 算法 。 为 了 使 算法 简单 一 些 , 我 们 假设 开始 时 每 个 语句 
自己 组 成 一 个 基本 块 ， 而 且 我 们 只 在 基本 块 的 开头 引 人 新 的 表达 式 计算 指令 。 为 了 保证 这 个 简 
化 不 会 降低 这 个 技术 的 有 效 性 , 如果 一 个 边 的 目标 结 点 有 多 个 前 驱 , 我 们 就 在 这 个 边 的 源 结 点 和 
目标 结 点 之 间 插 入 一 个 新 的 基本 块 。 这 么 做 显然 也 考虑 了 对 程序 中 所 有 的 关键 边 。 

我 们 把 每 个 基本 块 8 的 语义 抽象 为 两 个 集合 : e_uses 表示 B 中 计算 的 表达 式 , M e_hilly 表示 
被 8 杀 死 的 表达 式 , 即 某 个 运算 分 量 在 8 中 定 值 的 表达 式 的 集合 。 在 对 懒惰 代码 移动 技术 中 的 
四 个 数据 流 分 析 模 式 进行 讨论 时 , 将 会 一 直 使 用 例 9. 30。 这 四 个 数据 流 分 析 模式 在 图 9-34 中 进 
行 了 简单 的 定义 。 

EE) 在 图 9-33a 的 流 图 中 ,表达 式 b +c 出 现 三 次 。 因 为 基本 块 B 是 一 个 循环 的 一 部 分 ， 
块 中 的 表达 式 b +e 可 能 被 执行 很 多 次 。 在 By 中 对 此 表达 式 的 计算 不 仅 是 循环 不 变 的 ,， 它 还 是 一 
个 元 余 表达 式 ， 因 为 表达 式 的 值 已 经 在 基本 块 B, 中 使 用 。 对 于 这 个 例子 来 说 , 我 们 只 需要 计算 
b+c 两 次 : 一 次 在 基本 块 Bs 中 计算 , 而 男 一 次 在 B, 之 后 到 B, 之 前 的 路 径 上 计算 。 本 节 讨论 的 
懒惰 代码 移动 算法 将 把 表达 式 计算 放置 在 基本 块 B4 和 Bs 的 开头 。 口 
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a) b) 


图 9-33” 例 9.30 的 流 图 


预期 执行 的 (anticipated ) 表达 式 

回顾 一 下 预期 执行 的 定义 。 如 果 从 程序 点 p 出 发 的 所 有 路 径 最 终 都 会 计算 表达 式 b +c 的 值 ， 
并 且 计 算 时 5 和 < 的 值 就 是 它们 在 点 p 上 的 值 , 那么 我 们 说 表达 式 bte 在 程序 点 p 上 被 预期 
执行 。 

在 图 9-33a 中 , 所 有 在 其 人 口 处 预期 执行 表达 式 b+c 的 基本 块 都 用 浅 灰色 方块 表示 。 表 达 
zt b+c EEDI By. By, Bs, Bg. By 和 B% 中 被 预期 执行 。 它 在 B, 的 入 口 处 没有 被 预期 执行 ， 
这 是 因为 e 的 值 在 该 基本 块 内 被 重新 计算 , 因此 假如 在 8B 的 开始 处 计算 b+。 的 值 , 这 个 计算 结 
果 不 会 在 任何 路 径 上 被 使 用 。 在 B, 的 人 口 处 也 没有 预期 执行 上 + c， 因为 在 从 B, 到 By 的 分 支 上 
这 个 计算 是 不 必要 的 (虽然 在 路 径 B1 一 Bs 一 Bs。 上 使 用 了 这 个 计算 )。 类 似 地 , 因为 有 Bs 到 B11 的 
分 支 , 该 表达 式 也 没有 在 Bs 的 开头 被 预期 执行 。 一 条 路 径 上 的 各 个 结 点 是 否 预期 执行 一 个 表达 
式 可 能 会 不 断交 蔡 变 化 , 如 路 径 Bl B, By 所 示 。 : 

预期 执行 表达 式 问题 的 数据 流 方程 组 如 图 9-34b 所 示 。 问 题 的 分 析 过 程 是 逆向 的 。 只 有 当 
一 个 表达 式 在 基本 块 B 的 出 口 处 被 预期 执行 , 且 它 不 在 e_kills 集合 中 , 那么 它 在 基本 块 的 人 品 
Ne NR Nt 表示 基本 抉 8 新 使 用 了 其 中 的 表 
达 式 。 在 一 个 程序 的 出 口 处 没有 表达 式 被 预期 执行 。 我 们 关心 的 是 在 所 有 后 继 路 径 中 都 被 预期 
nes eae einen 因此 ， 和 我 们 在 9. 2. 6 节 中 讨论 可 用 表达 式 时 类 似 ， 
内 部 程序 点 的 初始 值 是 表达 式 的 全 集 U. 

可 用 (avaiable) 表达 式 

第 二 步 之 后 ， 一 个 表达 式 的 多 个 指 由 会 被 分 别 放置 到 该 表达 趟 首次 被 预期 执行 的 程序 点 上 。 








机 器 无 关 优 化 
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这 么 做 之 后 , 如 果 原 来 的 程序 中 所 有 到 达 程 序 点 p 的 路 径 都 预期 执行 这 个 表达 式 , 那么 现在 这 个 
表达 式 就 在 点 p 上 可 用 。 这 个 问题 和 9.2.6 节 中 描述 的 可 用 表达 式 问 题 类 似 。 但 是 这 里 使 用 的 
传递 函数 略 有 不 同 。 一 个 表达 式 在 一 个 基本 块 的 出 口 处 可 用 的 条 件 有 两 个 : 































































































a) 被 预期 执行 的 表达 式 b) 可 用 表达 式 

域 表达 式 集合 表 法 式 集合 

方向 逆向 前 向 
| 传递 fel) = TIe) = 

as e-usep U (x — e-killg) (anticipated[B].in U z) — e-killy 
| 边界 条 件 IN[EXIT] = @ | ouT(ENTRY] = Í 

交汇 运算 (A) | mn n 

方程 组 TIN[B] = fa (OUT{B)) ouT[B] = fpe(N[B]) 

ouT[B] = Ns,suce(B) SIS] IN[B] = Apprea(py OUTIPI 
初始 化 IN[B] =U ouT[B] =U 
c) 可 后 延 表 达 式 d) 被 使 用 的 表达 式 

| 域 表达 式 集合 表达 式 焦 合 

方向 前 向 逆向 

传递 Je)= fa(z) = 

ay (earliest[B] U z) — e-uses (e-usep U x) — latest|B] 

边界 条 件 OUTIENTRY] = 9 IN[EXIT] = 6 
| 交汇 运算 (A) | mn U 

方程 组 | ouT[B] = fp(IN[B]) IN[B] = fs (OUT[B)) 
L IN[B] = Ap preaçp) OUTP] | OUTIB] = 人 ssuce(B) MIS] 

初始 化 ouT[B] =U IN[B] = 9 


earliest|B] = anticipated[B].in — available[B].in 


latest[B| = (earliest(B] U postponable[B].in) N 
(euses U (Ps aucet (earliest[S] U postponable[S].in)) ) 





1) 下 列 条 件 之 一 成 立 


@ 在 入口 处 可 用 。 


@ 在 基本 块 的 人 口 处 所 预期 执行 的 表达 式 集合 中 ( 即 如 果 我 
们 选择 在 入 口 处 计算 这 个 表达 式 , 它 就 会 在 和 人口 处 变 得 可 用 ) 。 a = 


2) 没有 被 这 个 基本 块 杀 死 。 


用 于 可 用 表达 式 的 数据 流 方程 组 如 图 9-34b 所 示 。 为 了 避免 
混淆 IN 的 含义 , 我 们 在 数据 流 分 析 问 题 的 名 字 后 加 上 “[B1. in”, 


以 这 个 方式 来 表示 某 次 分 析 所 得 到 的 结果 。 


依据 最 前 放置 的 策略 而 在 一 个 基本 块 B 上 放置 


合 ( 即 earliest | 8]) 被 定义 为 被 预期 执行 但 不 可 


合 , 即 


earliest[ B] = anticipated[ B]. in ~ available[ B]. in. 
图 9-35 的 流 图 中 表达 式 b+c 在 基本 块 By 的 人 口 点 没 





图 9-34 ”部 分 元 余 消 除 中 的 四 个 数据 流 分 析 过 程 





b+c 

















图 9-35 





例 9. 
以 说 明 可 用 表达 式 的 使 用 





31 的 流 图 , 用 
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有 被 预期 执行 ,但是 在 基本 块 By 的 人 口 处 被 预期 执行 。 然 而 , 没有 必要 在 基本 块 B4 中 计算 表达 
stb +c, 因为 By 使 得 表达 式 5+c 在 此 处 变 得 可 用 。 口 
图 9-33a 中 带 有 黑色 阴影 的 各 个 基本 块 上 的 表达 式 + e 不 可 用 , 这 些 基本 块 是 Bi 、 
By, By 和 B; 。 该 表达 式 的 靠 前 放置 的 位 置 使 用 带 有 黑色 阴影 的 灰色 方块 表示 , 它们 是 By M B5. 
请 注意 , b+ 被 认为 在 B4 的 人口 处 可 用 , 因为 在 一 条 路 径 B81 一 B, 一 B3 一 Bs 中 , b +c 至 少 被 预期 
执行 一 次 一 一 在 这 个 例子 里 是 BLK It BW B 的 人口 点 开始 , 和 < 都 没有 被 重新 计算 。 ” 口 
2 x2 方块 的 补 全 

被 预期 执行 的 表达 式 (其 他 文献 中 也 称 之 为 “很 忙 的 表达 式 " ) 是 一 类 我 们 之 前 没有 看 到 
的 数据 流 分 析 。 昌 然 我 们 已 经 看 到 了 活跃 变量 分 析 ( 见 9. 2.5 节 ) 这 样 的 北向 框架 , ERNE 
到 了 可 用 表达 式 分 析 (9. 2. 6 节 ) 那 样 使 用 交集 运算 作为 交汇 运算 的 框架 。 这 是 第 一 个 具有 这 
两 个 特点 的 有 用 分 析 技术 的 例子 。 几 乎 我 们 使 用 的 所 有 分 析 技术 都 可 以 放 到 四 个 分 组 中 的 某 
一 个 中 。 这 四 个 组 按照 下 面 的 方法 进行 刻 划 : 它们 是 前 向 的 还 是 逆向 的 , 它们 是 使 用 并 集运 
| 算 还 是 交集 运算 作为 交汇 运算 (可 以 按照 这 两 个 特性 的 不 同 取 值 把 各 个 数据 流 分 析 模 式 分 别 
放 到 一 个 2 x2 方块 中 的 某 个 空格 中 ,而 本 节 的 分 析 技 术 填 补 了 方 阵 中 的 一 个 空格 , 译 者 注 )。 
同时 请 注意 ,使 用 并 集 的 分 析 总 是 涉及 是 否 存在 一 条 路 径 使 得 某 件 事情 为 真 ,而 使 用 交集 的 分 
析 考 虑 的 是 某 些 事情 是 否 对 于 所 有 的 路 径 都 为 真 。 



















可 后 延 ( postponable ) 表达 式 

算法 的 第 三 步 在 保持 原 程序 语义 并 将 元 余 最 小 化 的 情况 下 把 表达 式 的 计算 尽量 地 延 后 。 例 
9.33 说 明了 这 个 步骤 的 重要 性 。 B 
AR E ER 9-36 所 示 的 流 图 中 ,表达 式 5 +c 在 路 径 有 
>B; >B >B; 中 被 计算 两 次 。 表 达 式 + c 甚至 在 基本 块 B， 
的 开头 就 被 预期 执行 了 。 如 果 我 们 在 表达 式 被 预期 执行 的 时 
候 立 刻 计算 它 的 值 , 那么 我 们 就 要 在 B 中 计算 + e 的 值 。 
计算 结果 将 在 一 开始 就 被 保存 起 来 , 经 过 由 基本 块 B,、B3 组 
成 的 循环 的 执行 , 最 后 由 基本 块 B; 使 用 。 在 另 一 种 方法 中 ， 
我 们 可 以 把 表达 式 ! + ¢ 的 计算 推迟 到 Bs 的 开始 以 及 控制 流 
即将 从 By 到 达 By 的 时 候 。 口 

正式 地 讲 , 一 个 表达 式 x+y 可 后 延 到 程序 点 p 的 前 提 如 
下 : 在 所 有 从 程序 入口 结 点 到 达 p 的 路 径 中 都 会 碰 到 一 个 位 图 936 例 9 33 的 流 图 用 
置 较 前 的 x +y， 并 且 在 最 后 一 个 这 样 的 位 置 到 p 之 间 没 有 对 以 说 明 后 延 一 个 表达 式 的 需求 
x+y 的 使 用 。 
A 让 我 们 再 次 考虑 图 9-33 中 的 表达 式 5+c。 其 中 可 放置 5+c 的 两 个 最 前 的 点 是 B 和 
Bs. WER, 这 两 个 基本 块 在 图 9-33a 中 都 被 表示 为 带 有 黑色 阴影 的 灰色 方块 , 这 表示 在 且 只 在 
这 两 个 基本 块 上 5 + e 被 预期 执行 但 不 可 用 。 我 们 不 能 把 8+c 从 Bs 后 延 到 By, AX b +c TE Bs 
中 被 使 用 了 。 但 是 我 们 可 以 把 它 从 Bs 后 延 到 Bs。 

但 是 , 我 们 不 能 把 5+c 从 By 后 延 到 B MEERI b+c 在 Bs 中 没有 使 用 , 把 它 放 到 B 
中 而 不 是 B4 中 会 引起 路 径 BOB. B, 上 的 宛 余 计算 。 我 们 将 看 到 ，B4 是 我 们 能 够 计算 5+c 的 
最 后 位 置 之 一 。 口 
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可 后 延 表 达 式 问题 的 数据 流 方程 组 如 图 9-34c 所 示 。 这 个 分 析 过 程 是 前 向 的 。 我 们 不 能 把 -一 
个 表达 式 “ 后 延 " 到 程序 的 入 口 处 , 因此 OUTL ENTRY]= 6。 如 果 一 个 表达 式 在 B 中 没有 使 用 ， 
且 它 可 以 后 延 到 8B 的 入 口 处 , 或 者 它 在 earliest[ 8B8] 中 ,那么 它 就 可 以 被 后 延 到 B 的 出 口 处 。 除 非 
一 个 基本 块 的 所 有 前 驱 结 点 出 口 处 的 可 后 延 集合 中 都 包含 某 个 表达 式 , 否则 该 表达 式 不 能 被 后 
延 到 这 个 基本 块 的 入 口 处 。 因 此 , 这 个 数据 流 分 析 的 交汇 运算 是 交集 运算 ,并且 各 个 内 部 程序 点 
必须 被 初始 化 为 相应 半 格 的 顶 元 素 一 一 全 集 。 

粗略 地 说 , 一 个 表达 式 将 被 放置 在 边界 上 ， 即 一 个 表达 式 从 可 后 延 转变 成 为 不 可 后 延 的 地 
方 。 更 加 明确 地 说 , RER e 可 以 被 放置 在 基本 块 召 的 开始 处 的 前 提 条 件 是 该 表达 式 在 下 人 口 处 
的 earliest 集合 或 可 后 延 集 合 中 。 另 外 , 当下 列 条 件 之 一 成 立时 , Be 的 后 延边 界 中 : 

1) e 不 在 集合 postponable[ B]. out 中 。 换 名 话说 ,e 在 e_rusep Ho 

2) e 不 能 被 后 延 到 B 的 某 个 后 继 基本 块 。 换 名 话说 , 存在 一 个 B 的 后 继 基 本 块 使 得 e 不 在 该 
后 继 入 口 处 的 earliest 集合 和 可 后 延 集合 中 。 

因为 在 算法 的 预 处 理 阶段 引 人 了 新 的 基本 抉 , 所 以 在 上 述 两 种 情形 中 , 表达 式 。 可 以 放 在 基 
AR BNR 
图 933b 显示 了 上 述 分 析 的 结果 。 其 中 的 灰色 方块 表示 了 相应 earliest 集合 中 包含 b+ 
的 基本 块 ， 而 黑色 阴影 的 方块 表示 了 相应 可 后 延 集 合 中 包含 +e 的 基本 块 。 因 此 , 表达 式 b +e 
的 最 后 放置 位 置 在 基本 块 B, 和 B 的 入 口 处 , 这 是 因为 

1) b+c FEB, 的 可 后 延 集 合 中 , 但 是 不 在 B, 的 可 后 延 集 中 , 并 且 

2) B; 的 earliest EGAT b+c, 并 且 它 使 用 了 b +co 

如 图 所 示 , 该 表达 式 的 值 在 基本 块 B, 和 Bs 中 被 存放 到 临时 变量 上 中, 在 任何 其 他 地 方 的 
b +c 都 被 蔡 换 为 to 口 

被 使 用 的 ( used) 表达 式 

最 后 ,用 一 个 逆向 分 析 过 程 来 确定 一 个 被 引入 的 临时 变量 是 否 在 它 所 在 基本 块 之 外 的 其 他 
地 方 使 用 。 如 果 从 程序 点 p 出 发 的 一 条 路 径 在 表达 式 被 重新 求 值 之 前 使 用 了 该 表达 式 , 那么 我 们 
说 该 表达 式 在 点 p 上 被 使 用 。 这 个 分 析 实 质 上 是 活路 性 分 析 ( 是 对 表达 式 而 言 , 而 不 是 对 变量 而 
言 )。 

被 使 用 的 表达 式 问题 的 数据 流 方程 组 如 图 9-34d 所 示 。 这 个 分 析 过 程 是 逆向 的 。 如 果 一 个 
在 基本 块 B 的 出 口 点 被 使 用 的 表达 式 不 在 B 的 最 后 放置 (latest) 集 合 中 , 那么 它 也 是 一 个 在 8B 的 
入 口 点 处 被 使 用 的 表达 式 。 一 个 基本 块 生成 了 e_uses 集合 中 的 全 部 表达 式 , 就 是 说 新 近 使 用 了 
这 些 表 达 式 。 在 程序 的 出 口 处 没有 表达 式 被 使 用 。 因 为 我 们 关心 的 是 找 出 被 任何 后 续 路 径 所 使 
用 的 表达 式 ， 因 此 这 个 问题 的 交汇 运算 是 并 集运 算 。 因 此 , 各 个 内 部 点 必须 被 初始 化 为 相应 的 半 








综合 全 部 步骤 


本 算法 的 各 个 步骤 在 算法 9. 36 中 进行 了 汇总 。 
懒惰 代码 移动 。 
输入 : 一 个 流 图 , 其 中 每 个 基本 块 B H eusen Ml e_hillg 已 经 计算 得 到 了 。 
输出 : 一 个 经 过 修改 且 满 足 9. 5. 3 节 所 描述 的 懒 情 代码 移动 的 四 个 条 件 的 数据 流 图 。 
方法 : 
1) 在 每 条 进入 某 个 具有 多 个 前 驱 的 基本 块 的 边 上 插入 一 个 空 基本 块 。 
2) 按照 9-34a 中 的 定义 , 计算 出 所 有 基本 块 HY anticipated[ B]. in 的 值 。 
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3) 按照 9-34b 中 的 定义 , 计算 出 所 有 基本 块 刀 的 available[ B]. in 的 值 。 
4) 为 每 个 基本 块 B 计算 它 的 最 早 放 置 位置 ; 
| earliest{ B] = anticipated[ B ]. in ~ available[ B ]. in 
5) 按照 图 9-34c 的 定义 , 计算 出 所 有 基本 块 8 的 postponable| B]. in 的 值 。 
6) 计算 所 有 基本 块 8 的 最 后 放置 集合 : 
latest[ B] = (earliest[ B ] U postponable[ B]. in) N 
(e_useg N5 U 中 (earliest[ S] U postponable[ S]. in) ) ) 

请 注意 , 其 中 的 -= 表示 的 是 以 程序 中 所 计算 的 全 部 表达 式 的 集合 作为 全 集 的 补 集运 算 。 

7) 按照 图 9-34d 中 的 定义 , 找到 所 有 基本 块 8 AY used[ B). out 值 。 

8) 对 于 程序 计算 的 每 个 表达 式 ， 比 如 x ty, 做 下 列 处 理 : 

D 为 x+y 创建 一 个 新 的 临时 变量 ,比如 说 to 

@ 对 于 所 有 基本 块 B, 如 果 x +y 在 latest[B] Nused[B]. ow 中 ,就 把 :=x+y 加 入 到 8 的 
开头 。 

@ 对 于 所 有 基本 块 B, 如 果 x +y 在 集合 e usepmn(n latest| B] Uused. ou[B]) 中 ,就 用 上 来 
蕉 换 原来 的 每 个 %+y。 i 口 

总 结 

部 分 宛 余 消除 技术 用 统一 的 算法 归纳 出 不 同类 型 的 元 余 计 算 。 这 个 算法 说 明了 如 何 使 用 多 
个 数据 流 问题 来 寻找 最 优 的 表达 式 位 置 。 

1) 有 关 位 置 的 约束 由 预期 执行 表达 式 分 析 提 供 。 预 期 执行 表达 式 分 析 是 一 个 逆向 的 数据 流 
分 析 , 并 使 用 交集 运算 作为 交汇 运算 。 因 为 它 确定 的 是 对 于 各 个 程序 点 ,一 个 表达 式 是 否 在 该 点 
之 后 的 所 有 路 径 中 被 使 用 。 

2) 一 个 表达 式 的 最 前 放置 位 置 就 是 该 表达 式 在 其 上 被 预期 执行 但 又 不 可 用 的 程序 点 。 可 用 
表达 式 是 通过 一 个 前 向 数据 流 分 析 找 到 的 , 它 使 用 交集 运算 作为 交汇 运算 。 对 各 个 程序 点 , 这 个 
































数据 流 分 析 技术 计算 了 一 个 表达 式 是 否 在 所 有 路 径 中 都 在 该 点 之 前 被 巴 ate 
期 执行 。 l 
3) 一 个 表达 式 的 最 后 放置 位 置 就 是 该 表达 式 在 其 上 不 可 再 后 延 的 程 H] a, 
序 点 。 如 果 到 达 一 个 程序 点 的 所 有 路 径 都 没有 碰 到 某 个 表达 式 , 那么 该 ae 
表达 式 在 此 程序 点 上 可 以 后 延 。 可 后 延 表达 式 是 通过 一 个 前 向 的 数据 流 
分 析 技 术 找 到 的 , 这 个 分 析 技 术 使 用 交集 运算 作为 交汇 运算 。 race B, 
4) 除非 一 个 临时 赋值 语句 被 其 后 的 某 条 路 径 使 用 , 否则 该 赋值 语句 on 
可 以 被 消除 。 我 们 通过 一 个 逆向 的 数据 流 分 析 来 发 现 被 使 用 的 表达 式 ， | 
它 使 用 并 集运 算 作 为 交汇 运算 。 ese ee 
95.6 9.5 节 的 练习 -一 一 一 一 
练习 9. 5. 1: 对 于 图 9-37 中 的 流 图 : ! 
1) 计算 各 个 基本 块 的 开头 和 结尾 的 预期 执行 的 (anticipated ) 表达 式 ere eee 
集合 。 
2) 计算 各 个 基本 块 的 开头 和 结尾 的 可 用 (available) 表 达 式 集合 。 Ee 





3) 计算 各 个 基本 块 的 earliest 集合 。 
4) 计算 各 个 基本 块 的 开头 和 结尾 的 可 后 延 (postponable) 表 达 式 集合 。 图 9-37 练习 
5) 计算 各 个 基本 块 的 开头 和 结尾 的 被 使 用 的 (used) 表 达 式 集合 。 9.5.1 的 流 图 





机 器 无 关 优 化 | | ne 





6) 计算 各 个 基本 块 的 latest 集合 。 

7) 引信 临时 变量 4， 指出 它 在 什么 地 方 被 计算 , 并 在 什么 地 方 被 使 用 。 

练习 9. 5. 2: 对 于 图 9-10 中 的 流 图 ( 见 9.1 节 的 练习 ) 重 复 练 习 9.5.1。 你 可 以 只 分 析 表 达 式 
atb.c-aflbed, 

1) 练习 9.5.3: 在 本 节 中 讨论 的 概念 也 可 以 应 用 到 部 分 死亡 代码 的 消除 。 如 果 一 个 变量 的 
定 值 仅仅 对 于 部 分 路 径 活 跃 , 但 对 于 其 他 路 径 是 死亡 的 , 那么 这 个 定 值 就 是 部 分 死亡 的 (partially 
dead ) 。 我 们 可 以 只 在 该 变量 活路 的 路 径 上 执行 这 个 定 值 ， 从 而 优化 这 个 程序 的 执行 效率 。 在 消 
除 部 分 元 余 时 ,表达 式 被 移动 到 原来 的 表达 式 之 前 ; 和 消除 部 分 匈 余 相 反 ， 部 分 死亡 代码 消除 中 
新 的 定 值 被 放 在 原来 的 定 值 之 后 。 设 计 一 个 算法 来 删除 部 分 死亡 代码 , 使 得 表达 式 只 在 一 定 会 
被 使 用 时 才 进 行 求 值 。 


9.6 流 图 中 的 循环 


在 至 今 为 止 的 讨论 中 , 循环 并 没有 被 区 别 对 待 , 对 它们 的 处 理 方式 和 其 他 类 型 的 控制 流 没 有 
什么 不 同 。 但 是 , 循环 的 重要 性 在 于 程序 花费 大 部 分 时 间 来 执行 循环 , 改进 循环 效率 的 优化 有 很 
大 的 影响 。 因 此 , 识别 循环 并 有 针对 性 地 处 理 它们 是 很 重要 的 。 

循环 也 会 影响 程序 分 析 所 需 的 时 间 。 如 果 一 个 程序 不 包含 任何 循环 , 我们 只 需要 对 程序 进 
行 一 趟 扫描 就 可 以 得 到 数据 流 问 题 的 答案 。 比 如 ,一 个 前 向 数据 问题 只 需要 按照 拓扑 次 序 对 所 
有 的 结 点 进行 一 次 访问 就 可 以 解决 。 

在 这 一 节 中 , 我 们 将 介绍 下 列 概念 : 支配 结 点 、 深 度 优先 
排序 、 回 边 、 图 的 深度 和 可 归 约 性 。 我 们 在 后 面 进行 的 对 寻 
找 循 环 及 选 代 式 数据 流 分 析 的 收敛 速度 的 讨论 中 需要 用 到 这 


些 概念 。 a 
9.6.1 支配 结 点 Gy © 
如 果 每 一 条 从 流 图 的 人 口 结 点 到 结 点 ”的 路 径 都 经 过 结 ba = 





Kid, 我 们 就 说 4 支配 (dominate )m， 记 为 d dom n, HER, 
在 这 个 定义 下 每 个 结 点 支配 它 自己 。 

ER 28938 中 的 以 结 点 1 作为 人 口 结 点 的 流 图 。 
入 口 结 点 支配 所 有 结 点 (这 个 结论 对 所 有 的 流 图 都 成 立 )。 结 
点 2 只 能 支配 它 自己 ,因为 控制 流 可 以 通过 以 1»3 开头 的 路 
径 到 达 所 有 其 他 结 点 , 所 以 结 点 3 支配 除 1、2 之 外 的 所 有 结 
点 。 结 点 4 支配 除 1、2、3 之 外 的 所 有 其 他 结 点 , 因为 所 有 从 
1 FEA PREM TLE ABI, BABII, i 


(9 
E d 
AS 和 6 都 只 支配 它们 自身 , 因为 控制 流 可 以 选择 从 它们 中 3 
的 某 一 个 结 点 通过 ， 从 而 绕 过 另 一 个 结 点 。 最 后 , 结 点 7 支 人 oF 
(8) 
S 


图 9-38 一 个 流 图 


配 结 点 7、8、9、10; 结 点 8 支配 结 点 8、9、10; 9 和 10 只 支配 
它们 自身 。 口 
一 种 有 用 的 表示 支配 结 点 信息 的 方法 是 用 所 谓 的 支配 结 
”点 树 (dominator tree) 来 表示 。 在 树 中 ,入 口 结 点 就 是 根 结 点 ， 
并 且 每 个 结 点 4 只 支配 它 在 树 中 的 后 代 结 点 。 比 如 , 图 9-39 Are? hoes 
显示 了 图 9-38 中 流 图 的 支配 结 点 树 。 中 流 图 的 支配 结 点 树 
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支配 结 点 的 一 个 性 质 决定 了 一 定 存 在 支配 结 点 树 : 每 个 结 点 具有 了 唯一 的 直接 支配 结 点 
(immediate dominator)m。 和 在 从 入 口 结 点 到 达 结 点 n 的 任何 路 径 中 , 它 是 ”的 最 后 一 个 支配 结 点 。 
用 dom 关系 来 表示 , n 的 直接 支配 结 点 m 具有 以 下 性 质 : 如 果 dAn H ddomn, 那么 d dom m, 

我 们 将 给 出 一 个 简单 的 算法 来 计算 流 图 中 各 个 结 点 n 的 所 有 支配 结 点 。 这 个 算法 基于 如 下 
原理 : 如 果 pi, po, e, px 是 nn 的 所 有 前 驱 并 且 dn, 那么 d dom n 当日 仅 当 对 于 每 个 i, d dom 
pio 这 个 问题 可 以 写成 一 个 前 向 数据 流 分 析 问 题 。 数 据 流 的 值 域 是 基本 块 的 集合 。 一 个 结 点 的 
支配 结 点 集合 ( 它 自 己 除外 ) 是 它 的 所 有 前 驱 的 支配 结 点 的 交集 ; 因此 这 个 问题 的 交汇 运算 是 交 
集运 算 。 基 本 块 B 的 传递 函数 直接 把 B 自身 加 入 到 输入 结 点 集合 中 。 问 题 的 边界 条 件 是 ENTRY 





















































结 点 支配 它 自身 。 最 后 ,内 部 结 点 的 初始 值 是 全 集 , 也 就 是 所 有 结 点 的 集合 。 
寻找 支配 结 点 。 
输入 : 一 个 流 图 C，C 的 结 点 集 是 N, 边 集 是 
E, TATAE ENTRY, a Ror: 
输出 : 对 于 NN 中 的 各 个 结 点 n, 给 出 D(n)， [FA 前 向 
即 支配 n 的 所 有 结 点 的 集合 。 传递 函数 fa(x) = 2U {B) 
方法 : 求 出 由 图 9-40 给 定 参数 的 数据 流 问题 EAE 
roe sites oe ; 交汇 运算 (A) 
的 解 。 输 入 流 图 的 基本 块 就 是 结 点 。 对 于 NN 中 的 rece 
所 有 结 点 n, D(n) =OUT[n]. a INLBI= Ap preatay OUTIP) 
使 用 这 个 数据 流 算法 来 寻找 支配 结 点 很 高 效 。 | 初始 化 设置 ouT[B] = N 





我 们 将 在 9. 6.7 节 看 到 ,只 要 对 流 图 中 的 结 点 进 





行 几 次 访问 就 可 以 得 到 问题 的 解 。 PB AR, ee E ts 
| 关系 dom 的 性 质 


有 关 支 配 结 点 的 一 个 关键 性 质 是 如 果 我 们 从 人 口 结 点 沿 着 一 个 无 环 路 径 到 达 结 点 n, A 
An 的 所 有 支配 结 点 都 出 现在 这 条 路 径 中 ,并 且 它 们 总 是 以 相同 顺序 出 现在 所 有 这 样 的 路 径 
中 。 为 了 说 明 原 因 ,假设 在 一 个 到 达 n 的 无 环 路 径 P 中 支配 结 点 a 和 6b 的 顺序 为 先后 5, 而 
在 另 一 条 路 径 P, 中 5 在 4 之 前 。 那 么 我 们 可 以 沿 着 P| 到 达 e 然后 再 沿 着 P, BhA n, AmE 
开 了 6b。 因此 ,5 实际 上 不 支配 n。 e 

通过 这 个 推理 过 程 , 我 们 可 以 证 明 dom 是 传递 的 :如 果 a dom b #H b dom c, HRA a dom 
co 关系 dom 也 是 反对 称 的 :如 果 cz ,那么 ac dom b 和 4 dom a 不 可 能 同时 成 立 。 而 且 , 如 果 a 
和 5 是 7 的 两 个 支配 结 点 ,那么 adom b 或 dom a 中 必然 有 一 个 成 立 。 最 后 可 以 推出 除了 人 
口 结 点 之 外 的 每 个 结 点 ”必然 有 一 个 唯一 的 直接 支配 结 点 , 即 在 从 人 口 结 点 到 的 任何 无 环 
路 径 中 出 现 的 离 n 最 近 的 支配 结 点 。 











让 我 们 回顾 一 下 图 9-38 中 的 流 图 , 并 假设 图 9-23 中 第 (4) 到 (6) 行 的 for 循环 依照 数 
字 顺 序 访问 其 结 点 。 令 D(n) 为 00T[n] 中 的 结 点 的 集合 。 因 为 1 是 入 口 结 点 , 算法 的 第 一 行 首先 
把 和 1| 赋 给 D(1)。 结 点 2 的 前 驱 只 有 1, 因此 DO) = 121 UD(1)。 这 样 D(2) 就 被 设置 为 11, 21。 
然后 考虑 结 点 3, 它 的 前 驱 是 1、2、4 和 8。 因 为 所 有 内 部 结 点 的 值 都 被 初始 化 为 结 点 的 全 集 
D(3) =!3U0PnD 2n 2, 1I0nil 2, --, 10}) =41, 3} : 
其 余 的 计算 过 程 如 图 9-41 所 示 。 因 为 在 图 9-23a 中 , 第 (3) 到 (6) 行 的 外 层 循环 的 第 二 次 迭代 中 ， 
这 些 值 不 再 改变 ,它们 就 是 这 个 支配 结 点 问题 的 最 终 答案 。 1E 
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D(a) = {4} U (D(3) N D(7)) = {4} U ULI} 14,2... 10}) = {1,3,4} 
5) = {5} U D(4) = {5} U {1,3,4} = {1,3,4,5} 
D(6) = {6} U D(4) = {6} U {1,3,4} = {1,3,4,6} 
D(7) = {7} U (DUS) N D(6) N D(10)) 
= {7} U {1,3,4,5} 9 {1,3,4,6} N {1,2,... ,10}) = {1,3,4,7} 
= {8} U D(7) = {8} U {1,3,4,7} = {1,3, 4,7,8} 
D(9) = {9} U D(8) = {9} U {1,3,4,7,8} = {1,3,4,7,8,9} 
D(10) = {10} U D(8) = {10} U {1,3,4,7,8} = {1,3, 4,7,8, 10} 


= 
Z 











图 9-41 例 9.39 中 支配 结 点 计算 的 最 终结 果 


9.6.2 深度 优先 排序 
如 2. 3. 4 节 中 所 介绍 的 , 对 一 个 流 图 的 深度 优先 搜索 (depth-first search) 逐一 访问 图 的 所 有 结 
点 。 搜 索 过 程 从 入口 结 点 开始 , 并 首先 访问 离 人 口 结 点 最 远 的 结 点 。 一 个 深度 优先 过 程 中 的 搜 
索 路 线形 成 了 一 个 深度 优先 生成 树 (Depth-First Spanning Tree，DFST) 2.3.4 节 介 绍 过 , 一 个 先 
序 遍 历 过 程 首先 访问 一 个 结 点 ,然后 从 左 到 右 递归 地 访问 该 结 点 的 子 结 点 。 另 外 ， 一 个 后 序 遍历 
过 程 首先 递归 地 从 左 到 右 访问 一 个 结 点 的 子 结 点 ,然后 访问 该 结 点 本 身 。 
还 有 一 种 排序 方式 对 于 流 图 分 析 很 重要 : 深度 优先 排序 (depth-first ordering) 。 它 的 顺序 正好 
和 后 序 遍 历 的 顺序 相反 。 也 就 是 说 , 在 深度 优先 排序 中 , 我 们 首先 访问 一 个 结 点 ,然后 遍历 该 结 
点 的 最 右 子 结 点 ,再 遍历 这 个 子 结 点 左边 的 子 结 点 , 依 此 类 推 。 但 是 在 我 们 为 流 图 构造 生成 树 之 
前 ,我们 可 以 选择 把 一 个 结 点 的 哪个 后 继 作 为 它 在 树 中 的 最 右 子 结 点 ,再 选择 哪个 后 继 是 下 一 个 
子 结 点 ,等 等 。 在 我 们 给 出 深度 优先 排序 的 算法 之 前 , 首先 考虑 一 个 例子 。 
ET) 59-38 中 流 图 的 一 个 可 能 的 深度 优先 表示 法 如 图 9-42 所 示 。 实 线 边 形成 了 这 棵 树 ， 
虚线 边 是 流 图 中 其 他 的 边 。 这 棵 树 的 深度 优先 遍历 是 13 一 4-6-7-8-10,， 然后 回 到 8 ， 再 到 
9。 我 们 再 一 次 回 到 8, 再 回 到 7、6 和 4, 然后 前 进 到 5。 我 们 从 5 回 到 4, 然后 回 到 3 和 1。 我 们 
从 1 前 进 到 2, 然后 从 2 回 到 1。 这 样 我 们 就 遍历 了 整 棵 树 。 
因此 , 这 次 遍历 的 前 序 序列 是 ; 
1,3,4,6,7,8, 10,9,5,2 
图 9-42 中 树 的 后 序 遍 历 顺序 是 : 
10,9,8,7,6,5,4,3,2,1 
深度 优先 排序 的 顺序 和 后 序 遍 历 序列 相反 ， 即 
1,2,3,4,5,6,7,8,9,10 口 
现在 我 们 给 出 一 个 算法 来 寻找 一 个 流 图 的 深度 优先 生成 树 和 相应 的 深度 优先 排序 。 正 是 这 
个 算法 从 图 9-38 的 流 图 中 找到 了 图 9-42 中 的 DEST. 
深度 优先 生成 树 和 深度 优先 排序 。 
输入 : 一 个 流 图 C。 
输出 : 6 的 一 个 DFST 树 了 和 6 中 结 点 的 一 个 深度 优先 排序 。 
方法 : 我 们 使 用 图 9-43 的 递归 过 程 search(n)。 这 个 算法 首先 把 6 的 所 有 结 点 初始 化 为 ， 
“unvisited” , 然后 调用 search( ng), 其 中 no 是 人 口 结 点 。 当 它 调用 search(n) 的 时 候 , 首先 把 n 标 
记 为 “visited”, 以 免 把 n 再 次 加 入 到 树 中 。 它 使 用 < 作为 计数 器 , 从 G 的 结 点 总 数 一 直 倒 计 数 到 
1。 在 算法 执行 的 时 候 把 < 的 值 赋 给 结 点 ”的 深度 优先 编号 dn[n] 。 边 的 集合 了 形成 了 CG 的 深度 
优先 生成 树 。 o 
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void scarch(n) { 


19 n HRI visited”; 
ONN for (7 的 各 个 后 继 s) 
i s 标记 为 "unvisited” ) { 
k O naak C) x FRA n= s JARIT H; 
! 7 S ~N search(s); 
» o N } 
a --(4) x k dfn{n} = 6; 
a ra a i \ Se=; 
S Bi ff 
- ' í 
1 






| i pera 1 1 main() { 
oD jf T= 0; /* sbi */ 
区 ra aot á for (GRAAN) 
/ gt pe 把 并 标记 为 mvisited”: 
BY as css “= G 的 结 点 个 数 ; 


i + PA i 
4 ye 3 S search(no): 








图 9-42 图 9-38 中 流 图 的 一 个 深度 优化 表示 图 9-43 深度 优先 搜索 算法 


















































对 于 图 9-42 中 的 流 图 , 算法 9.41 把 c 设 置 为 10, 并 调用 search(1) 开始 搜索 。 其 余 的 
执行 序列 显示 在 图 9-44 中 。 口 

调用 search(1) 结 点 1 有 两 个 后 继 。 假 设 首先 考虑 s = 3 ， 
把 边 1 一 3 加 入 到 了 中 。 

调用 search(3) 把 边 3 一 4 加 入 到 工 中 。 

调用 search(4) 结 点 4 有 两 个 后 继 ，4 和 6 。 假 设 首先 考虑 s==6. 
把 边 4 一 6 加 入 到 了 中 。 

调用 search(6) 把 边 6 一 7 加 入 到 工 中 。 

调用 search(7) 结 点 7 有 两 个 后 继 结 点 4 和 8 。 但 是 4 已 经 被 search(4) 
标记 为 “visited”， 因 此 当 s = 4 时 不 做 任何 处 理 。 
对 于 s = 8， 把 边 7 一 8 加 入 到 了 中 。 

调用 search(8) 结 点 8 有 两 个 后 继 ，9 和 10 。 假 设 首先 考虑 s = 10， 
把 边 8 一 10 加 入 到 人 中。 

调用 search(10) 10 有 后 继 7 ,但 是 7 已 经 被 标记 为 “visited”。 
因此 search(10) 设置 dfn[10] = 10, c= 9 并 结束 。 

回 到 search(8) 把 s 设置 为 9， 并 把 边 8 一 9 加 入 到 工 中 。 

调用 search(9) 9 的 唯一 后 继 1 已 经 被 设置 为 “visited ”, 
因此 设置 dfn[9] =9 ,c=9, 

回 到 search(8) 8 的 最 后 一 个 后 继 3 已 经 是 “visited ”， 因 此 
不 处 理 s = 3 的 情况 。 到 此 为 止 , 8 的 所 有 后 继 
都 已 经 处 理 过 了 ， 因 此 设置 uprl8] =8,c=7. 

回 到 search(7) 7 的 所 有 后 继 都 已 经 处 理 过 了 ,因此 设置 
dfn{7] =7 ,c=6, 

RIFI search(6) 6 的 所 有 后 继 都 已 经 处 理 过 了 ,因此 设置 
dfn[6]=6 ,c=5, 

FEI search (4) 4 的 后 继 3 已 经 是 “visited ”， 但 是 5 还 没有 ， 
因此 把 边 4 一 5 加 入 到 树 中 。 

调用 search(5) 5 的 后 继 7 已 经 是 “visited "” ， 因 此 设置 dfpnl5] = 5 ， 
c=4, 

回 到 search(4) 4 的 所 有 后 继 都 已 经 处 理 过 了 ， 因此 设置 dfn[4] = 4 ， 
c=3, 

可 到 search(3) 设置 dfnl3] = 3,c=2。 

回 到 search(1) 2 尚未 被 处 理 ， 因 此 把 边 1 一 2 加 入 到 下 中 。 

调用 search(2) 设置 dfn[2] =2,c=1, 

同 到 search(1) 设置 dfn[l1] =1,c=0。 





| 


图 9-44 算法 9.41 在 图 9-42 的 流 图 上 执行 的 过 程 
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9.6.3 深度 优先 生成 树 中 的 边 

当 我 们 为 一 个 流 图 构造 DFST 时 , 流 图 的 边 可 以 被 分 为 三 大 类 : 

1) 前 进 边 (advancing edge)， 即 那些 从 一 个 结 点 m 到 达 m 在 树 中 的 一 个 真 后 代 结 点 的 边 。 
pFST 中 的 所 有 边 本 身 都 是 前 进 边 。 在 图 9-42 中 没有 其 他 的 前 进 边 。 但 是 , 假如 有 一 条 边 4 一 8， 
那么 这 条 边 就 是 前 进 边 。 

2) 有 些 边 从 一 个 结 点 m 到 达 m 在 树 中 的 某 个 祖先 (包括 m 自身 ), 我 们 将 把 这 些 边 称 为 后 
i i (retreating edge)。 比 如 , 图 9-42 中 的 4-3, 7-4, 83, 107 和 9 一 1 都 是 后 退 边 。 

3) 对 于 有 些 边 mon, 在 DFST 中 m 和 n 都 不 是 对 方 的 祖先 。 边 2 一 3 和 5 一 7 是 图 9-42 中 这 
种 边 的 例子 。 我 们 把 这 种 边 称 为 交叉 边 (cross edge) 。 交 叉 边 的 一 个 重要 性 质 是 : 如 果 我 们 把 一 
个 结 点 的 子 结 点 按照 它们 被 加 入 到 树 中 的 顺序 从 左 到 右 排列 , 那么 所 有 的 交叉 边 都 是 从 右 到 
左 的 。 

应 该 注意 , 边 mon 是 一 个 后 退 边 当 且 仅 当 dfn[m] 宇 dfn[n]。 为 了 说 明 原 因 , 请 注意 如 果 m 
是 nn 在 DFST 中 的 一 个 后 代 , 那么 search(m) 在 search(n) 之 前 运行 结束 , 因此 dmim] =df[n]. . 
KR, WR dnim] Sdf[n], WAZA search(m) Æ search(n) 之 前 结束 , 要 么 m=n。 但 是 如 
果 有 一 条 边 mon, 那么 search(n) 必 须 在 search(m) 之 前 开始 , 否则 n 是 m 的 后 继 的 事实 将 使 得 m 
RA n 在 DFST 中 的 一 个 后 代 。 因 此 , search(m) 运 行 的 时 间 是 search(n) 运 行 时 间 中 的 一 个 区 间 ， 
由 此 我 们 可 以 知道 n 是 m 在 DFST 中 的 一 个 祖先 。 

9.6.4 ” 回 边 和 可 归 约 性 

回 边 是 指 一 条 边 a 一 4b, CHL b 支配 了 它 的 尾 c。 对 于 任何 流 图 , 每 条 回 边 都 是 后 退 边 , 但 
并 不 是 所 有 的 后 退 边 都 是 回 边 。 如 果 一 个 流 图 的 任何 深度 优先 生成 树 中 所 有 后 退 边 都 是 回 边 ， 
那么 该 流 图 被 称 为 可 归 约 的 (reducible) 。 换 名 话说， 如 果 一 个 流 图 是 可 归 约 的 , 那么 它 的 所 有 
DFST 的 后 退 边 的 集合 都 是 相同 的 , 并 且 就 是 流 图 的 回 边 集合 。 但 如 果 流 图 是 不 可 归 约 的 ( 即 不 
是 可 归 约 的 ), 那么 所 有 的 回 边 在 任何 DFST 中 都 是 后 退 边 , 但 是 每 个 DFST 中 都 可 能 男 有 一 些 后 
退 边 不 是 回 边 。 这 样 的 后 退 边 集合 在 不 同 的 DFST 中 有 所 不 同 。 因 此 ,如 果 我 们 删除 流 图 中 所 有 
回 边 后 得 到 的 流 图 带 有 环 , 那么 该 图 就 是 不 可 归 约 的 。 反 过 来 也 成 立 。 














为 什么 回 边 是 后 退 边 
假设 a 一 2 是 一 条 回 边 , 即 它 的 头 支配 它 的 尾 。 当 图 9-43 中 的 search 函数 到 达 a 时， 对 
search 的 调用 序列 必然 是 流 图 中 的 一 条 路 径 。 当 然 , 这 条 路 径 必然 包含 a 的 所 有 支配 结 点 。 
由 此 可 知 ， 当 search(&) 被 调用 时 , 对 serach (b) 的 调用 必然 已 经 开始 但 尚未 结束 。 因 此 , 4a 
被 加 入 到 树 中 时 5 已 经 在 树 中 , 并 且 a 是 作为 5 的 一 个 后 代 被 加 入 的 。 因 此 ab 必然 是 一 条 
后 退 边 。 











在 实践 中 出 现 的 流 图 几乎 都 是 可 归 约 的 。 如 果 只 使 用 诸如 if-then-else 、while-do、continue 和 
break 语句 这 样 的 结构 化 控制 流 语句 , 那么 得 到 的 程序 的 流 图 总 是 可 归 约 的 。 即 使 使 用 了 goto if 
A, 程序 也 经 常 是 可 归 约 的 ,因为 程序 员 在 逻辑 上 会 使 用 循环 和 分 支 的 O 


方式 思考 问题 KD 
图 9-38 的 流 图 是 可 归 约 的 。 图 中 的 所 有 后 退 边 都 是 回 边 。 St 

也 就 是 说 , 这 些 边 的 头 支配 各 自 边 的 尾 。 口 。 图 9.45 不 可 归 约 
考虑 图 9-45 中 的 流 图 , 它 的 初始 结 点 是 1。 结 点 1 支配 结 点 流 图 的 规范 形式 
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2 和 3, 但 是 2 不 支配 3, 3 也 不 支配 2。 因 此 , 这 个 流 图 没有 回 边 , 因为 没有 哪 条 边 的 头 支配 其 尾 
结 点 。 根 据 我 们 选择 从 search (1) 首先 调用 search(2) 还 是 search(3) , 可 以 得 到 两 个 可 能 的 深度 优 
先生 成 树 。 在 第 一 种 情况 下 , 32302 是 一 个 后 退 边 但 不 是 回 边 ; 在 第 二 种 情况 下 , 23 是 一 个 
后 退 边 但 不 是 回 边 。 直 观 地 讲 ， 使 得 这 个 流 图 不 可 归 约 的 原因 是 环 2.3 可 以 由 两 个 不 同 的 地 方 进 
A: 结 点 2 和 结 点 3。 o 
9.6.5 流 图 的 深度 

给 定 一 个 流 图 的 深度 优先 生成 树 , 该 流 图 的 深度 (depth) 是 各 条 无 环 路 径 上 的 后 退 边 数目 中 
的 最 大 值 。 我 们 可 以 证 明 这 个 深度 永远 不 会 大 于 直观 上 所 说 的 流 图 中 循环 嵌 套 的 深度 。 如 果 一 
个 流 图 是 可 归 约 的 , 那么 我 们 可 以 用 “ 回 边 "来 兰 换 上 面 的 “深度 "定义 中 的 “后 退 边 ”， 因为 任何 
DFST 中 的 后 退 边 集合 就 是 回 边 集合 。 深 度 的 定义 因此 独立 于 实际 所 选 的 DEST, 我 们 确实 可 以 说 
“一 个 流 图 的 深度 ”, 而 不 是 流 图 的 特定 于 某 个 深度 优先 生成 树 的 深度 。 
ERE 图 9-42 中 流 图 的 深度 是 3, 因为 有 一 条 具有 三 条 后 退 边 的 路 径 

















10 一 7 一 4 一 3 
但 是 没有 包含 四 个 或 更 多 后 退 边 的 无 环 路 径 。 这 里 的 最 " 深 ” 的 路 径 恰巧 只 包含 了 后 退路 径 , 这 
只 是 一 个 巧合 。 一 般 来 说 , 在 一 个 最 深 路 径 中 可 以 包含 后 退 边 、 前 进 边 和 交叉 边 。 口 





9.6.6 自然 循环 

在 一 个 源 程序 中 , 循环 可 以 有 很 多 种 描述 方法 : 它们 可 以 被 写成 for 循环 、while 循环 或 repeat 
循环 ; 它们 甚至 还 可 以 用 标号 和 goto 语句 来 定义 。 从 程序 分 析 的 角度 来 看 , 循环 在 源 代码 中 以 什 
么 形式 出 现 并 不 重要 , 重要 的 是 它们 是 否 具有 易于 被 优化 的 性 质 。 我 们 特别 关心 的 是 一 个 循环 
是 否 只 有 一 个 唯一 的 入 口 结 点 。 如 果 是 这 样 , 编译 器 的 分 析 可 以 假设 某 些 初始 条 件 在 循环 的 每 
次 迭代 的 开头 成 立 。 这 种 优化 机 会 引发 了 定义 “自然 循环 "的 需求 。 

自然 循环 (natural loop) 通过 两 个 重要 的 性 质 来 定义 。 

1) 它 必 须 具 有 一 个 唯一 的 入 口 结 点 , 称 为 循环 头 (header)。 这 个 人 口 结 点 支配 了 循环 中 的 
所 有 结 点 , 否则 它 就 不 会 成 为 循环 的 唯一 入 口 。 

2) 必然 存在 一 条 进入 循环 头 的 回 边 ， 否 则 控制 流 就 不 可 能 从 “循环 "中 直接 回 到 循环 头 , 也 
就 是 说 实际 上 并 没有 循环 。 

给 定 一 个 回 边 nd, 我 们 定义 该 边 的 自然 循环 (natural loop of the edge) Æ d 加 上 那些 不 经 过 
d 就 能 够 到 达 n 的 结 点 的 集合 。 结 点 d 是 这 个 循环 的 循环 头 。 
955% 9. 46 构造 一 条 回 边 的 自然 循环 。 

输入 : 一 个 流 图 C 和 一 条 回 边 nd, 

输出 : 由 回 边 nd 的 自然 循环 中 的 所 有 结 点 组 成 的 集合 loop。 

方法 : 令 loop Fin, d| 。 把 4 标记 为 “visited”, 以 便 搜索 过 程 不 至 于 越过 结 点 4。 从 结 点 7 
开始 对 输入 的 反 向 控制 流 图 进行 深度 优先 的 搜索 。 把 所 有 访问 到 的 结 点 都 加 入 loop。 这 个 过 程 
可 以 找到 所 有 不 经 过 d 就 可 以 到 达 n 的 结 点 。 o 
CERA 在 图 938 中 有 五 条 回 边 , 这 些 边 的 头 结 点 支配 了 它们 的 尾 结 点 。 它 们 是 : 1057, 74, 
433,83 和 9- 1。 请 注意 , 这些 边 恰好 就 是 所 有 的 被 认为 在 流 图 中 形成 循环 的 边 。 

回 边 10-*7 有 自然 循环 17, 8, 10], 因为 8 和 10 是 不 经 过 7 就 能 到 达 10 的 结 点 。 回 边 74 
的 自然 循环 由 14, 5; 6, 7, 8, 10| 组 成 , 因此 包含 了 回 边 107 的 循环 。 因 此 , 我 们 假设 后 者 是 
包含 在 前 者 中 的 一 个 内 部 循环 。 
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回 边 4 一 3 和 8 一 3 的 自然 循环 具有 同样 的 头 , 即 结 点 3; 它们 恰巧 具有 同样 的 结 点 集合 : {3， 
4,5,6,7,8, 101。 因 此 , 我 们 将 把 这 两 个 循环 合并 成 为 一 个 。 这 个 循环 包含 了 前 面 找到 的 两 个 
较 小 的 循环 。 

最 后 , 回 边 9 一 :1 的 自然 循环 是 整个 流 图 , 因此 是 最 外 层 的 循环 。 在 这 个 例子 中 , 四 个 循环 是 
ZAREK. Rm, 通常 会 有 两 个 互 不 包含 的 循环 。 口 

因为 一 个 可 归 约 的 流 图 中 的 所 有 后 退 边 都 是 回 边 , 我 们 可 以 把 每 条 后 退 边 和 一 个 自然 循环 
关联 起 来 。 这 个 结论 对 于 不 可 归 约 流 图 不 成 立 。 上 比如, 图 9-45 中 的 不 可 归 约 流 图 中 有 一 个 由 结 
点 2 和 3 组 成 的 环 。 环 中 的 边 都 不 是 回 边 , 因此 这 个 环 不 满足 自然 循环 的 定义 。 我 们 并 不 把 这 个 
环 当 作 自然 循环 ， 因 此 也 不 会 优化 它 。 这 种 情况 是 可 接受 的 ,因为 假设 所 有 循环 都 有 唯一 的 人 日 





点 可 以 使 循环 分 析 变 得 更 加 简单 。 而 且 不 管 怎么 说 , 不 可 归 约 的 程序 在 N 
实践 中 很 少见 到 。 


如 果 我 们 只 把 自然 循环 当 作 “循环 ", 那么 可 以 得 到 下 面 的 有 用 性 
质 ,， 即 除非 两 个 循环 具有 同样 的 循环 头 , 否则 它们 要 么 是 分 离 的 , BA 
一 个 典 套 在 另 一 个 中 。 这 样 我 们 就 很 自然 地 得 到 了 最 内 层 循环 (inner E D 
most loop) 的 定义 ， 即 不 包含 其 他 循环 的 循环 。 
当 两 个 自然 循环 像 图 9-46 中 那样 具有 相同 的 循环 头 时 ,很 难说 谁 ”图 9 46 有 具有 相同 
是 内 层 的 循环 。 因 此 ， 如 果 两 个 自然 循环 具有 相同 的 循环 头 且 没有 哪 一 ”种 环 关 的 两 个 循环 
个 循环 真正 包含 在 另 一 个 循环 中 , 它们 将 被 合并 在 一 起 ， 当 作 一 个 循环 处 理 。 
在 图 9-46 中 的 回 边 3-*1 和 4--*1 的 自然 循环 分 别 是 {1, 2, 3| 和 {1 ,2, 4| 。 我 们 将 把 
它们 合并 成 一 个 循环 {1, 2, 3, 41. 
然而 , 假如 图 9-46 中 有 另 一 个 回 边 2-»1，, 它 的 循环 是 11, 21 。 这 个 循环 将 是 第 三 个 以 1 为 
循环 头 的 自然 循环 。 这 个 循环 真 包含 于 循环 11, 2, 3, 4| , 因此 它 不 会 和 其 他 两 个 自然 循环 合并 ， 
而 是 作为 包含 在 11, 2, 3, 4} 中 的 内 层 循环 进行 处 理 。 口 
9. 6.7， 迁 代 数据 流 算法 的 收敛 速度 
我 们 现在 可 以 讨论 迭代 算法 的 收敛 速度 了 。 如 9. 3. 3 节 中 所 讨论 的 , 算法 的 最 大 和 迭代 次 数 可 
能 是 格 的 高 度 和 流 图 结 点 数 的 乘积 。 对 于 很 多 数据 流 分 析 而 言 , 我 们 可 以 对 求 值 过 程 进行 适当 
排序 , 使 算法 经 过 很 少 的 迭代 就 能 收敛 。 我 们 感 兴趣 的 性 质 是 是 否 所 有 影响 一 个 结 点 的 重要 事 
件 都 可 以 通过 一 个 无 环 的 路 径 到 达 该 点 。 在 至 今 已 经 讨论 过 的 数据 流 分 析 问题 中 , 到 达 定 值 、 可 
用 表达 式 和 活跃 变量 问题 具有 这 个 性 质 , 而 常量 传递 则 不 具有 这 个 性 质 。 更 加 明确 地 说 : 
o 如 果 一 个 定 什 d 在 IN[ 8B] 中 , 那么 必然 有 一 条 从 包含 d 的 基本 块 到 达 B 的 无 环 路 径 使 得 d 
在 该 路 径 上 的 所 有 IN 和 OUT 值 中 。 
o 如 果 表 达 式 x+y 在 基本 块 B 的 人 口 处 不 可 用 , 那么 必然 有 一 条 具有 下 列 性 质 的 无 环 路 
径 : 要 么 该 路 径 从 程序 的 入 口 结 点 出 发 并 且 不 包含 任何 杀 死 或 产生 x+y 的 语句 ; BARK 
路 径 从 一 个 杀 死 了 x +y 的 基本 抉 出 发 , 并 且 从 此 之 后 该 路 径 中 没有 产生 表达 式 tyo 
o 如 果 x 在 基本 块 8 的 出 口 处 活跃 , 那么 必然 有 一 个 从 8 开始 到 达 对 * 的 某 次 使 用 的 无 环 
路 径 , 在 此 路 径 上 没有 对 x 的 定 值 。 
我 们 可 以 检验 出 在 上 述 各 个 情况 中 , 带 有 环 的 路 径 不 会 增加 任何 内 容 。 比 如 , 如 果 可 以 通过 
一 个 带 环 的 路 径 从 基本 块 B 的 结尾 到 达 % 的 使 用 点 , 那么 我 们 可 以 消除 这 个 环 , 得 到 一 个 更 短 的 
路 径 。 沿 着 这 个 较 短 路 径 依然 可 以 从 B 到 达 % 的 这 个 使 用 点 。 
反 过 来 , 常量 传播 就 没有 这 个 性 质 。 考 虑 如 下 一 个 简单 程序 , 它 仅 包含 一 个 由 单个 基本 块 组 
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成 的 循环 , 基本 块 中 的 代码 为 
L: 


当 第 一 次 访问 这 个 基本 块 时 , 我 们 发 现 c 具 有 常量 值 1, 但 是 a 和 和 4 没有 定 值 。 第 二 次 访问 
该 基本 块 时 , 我 们 发 现 b 和 cc 都 有 常量 值 1。 经 过 对 该 基本 抉 的 三 次 访问 之 后 , RA c 的 常量 值 1 
A BIA ao 

如 果 所 有 有 用 的 信息 都 通过 无 环 路 径 传播 , 我 们 就 有 可 能 调整 迭代 数据 流 算法 中 访问 结 点 
的 顺序 ,以便 经 过 几 轮 结 点 访问 就 可 以 保证 这 些 信 息 已 经 沿 着 所 有 的 无 环 路 径 传递 完毕 。 

回顾 一 下 9. 6. 3 节 中 说 过 , WE ab 是 一 条 边 , 那么 只 有 当 该 边 是 后 退 边 的 时 候 4 的 深度 优 
先 编号 才 会 小 于 a 的 编号 。 对 于 前 向 的 数据 流 问题 ,按照 深度 优先 顺序 来 访问 结 点 是 很 合适 的 。 
明确 地 说 ,我 们 对 图 9-23a 中 的 算法 进行 修改 , 把 算法 中 访问 流 图 中 各 个 基本 块 的 第 (4) 行 代码 











for (按照 深度 优先 顺序 ， 对 所 有 不 同 于 ENTRY 的 各 个 基本 块 8) | 
假设 一 个 定 值 d 在 如 下 路 径 上 传播 ，: 
351935 16-23 45 4-10-17 

其 中 的 整数 表示 该 路 径 上 的 各 个 基本 块 的 深度 优先 编号 。 那 么 , 图 9-23a 中 算法 的 第 (4) 到 (6) 
行 的 循环 第 一 次 运行 时 , d 将 从 OUT[3] 传 播 到 IN[5] 再 传播 到 OUT[5],…, 最 后 到 达 OUT 
[35]。 因 为 16 排 在 35 之 前 , a 不 会 在 这 一 轮 中 到 达 IN[16]。 在 d 被 放 进 OUT|35] 的 时 候 , 我 们 
已 经 计算 了 IN[16]。 但 是 下 次 我 们 运行 第 (4) 到 (6) 行 的 循环 时 , 因为 此 时 d 已 经 在 OUT|[ 35] 
中 , 它 将 在 计算 IN[16] 的 时 候 被 加 入 进去 。 定 值 d 同时 会 被 传播 到 OUT[16], IN[23] ,…, 最 后 
到 达 OUT[45]。 它 必须 在 这 里 等 待 下 一 轮 计算 , 因为 这 一 轮 中 已 经 计算 过 IN[4] 了 。 在 第 三 轮 
中 , d 将 传播 到 IN[4], OUT[4], IN[LI0] 和 HL17]。 因 此 在 三 轮 之 后 我 们 使 得 定 值 d 到 达 了 基 
本 块 17。 口 

从 这 个 例子 中 不 难 抽取 出 一 般 规律 。 如 果 我 们 在 图 9-23a 中 使 用 深度 优先 排序 , 那么 把 任何 
到 达 定 值 沿 着 一 条 无 环 路 径 传播 所 需要 的 迭代 轮 次 不 会 大 于 路 径 中 从 高 编号 基本 块 到 低 编号 基 
本 块 的 边 的 个 数 加 一 。 这 些 边 恰好 就 是 后 退 边 , 因此 , 所 需 轮 次 就 是 流 图 的 深度 加 一 。 当 然 , A 
法 9. 11 还 需要 再 做 一 次 不 改变 任何 值 的 迭代 , 才能 检测 出 所 有 定 值 都 已 经 被 传播 到 了 所 有 它 能 
够 到 达 的 地 方 。 因 此 , 使 用 了 深度 优先 基本 块 排序 的 这 个 算法 所 执行 的 迭代 轮 次 的 上 限 实际 上 
是 深度 加 二 。 一 项 研究 2 表明 , 常见 流 图 的 平均 深度 大 约 是 2.75。 央 此 这 个 算法 的 收敛 速度 
很 快 。 











产生 不 可 归 约 数据 流 图 的 一 个 原因 
在 一 种 情况 下 我 们 通常 不 能 指望 一 个 流 图 是 可 归 约 的 。 如 果 像 我 们 在 算法 9. 46 中 寻找 
自然 循环 所 做 的 那样 ,把 一 个 程序 的 流 图 的 边 反 向 , 那么 我 们 不 大 可 能 得 到 一 个 可 归 约 流 图 。 
直观 的 理由 是 , 虽然 典型 程序 的 循环 只 有 一 个 人口 , 但 这 些 循环 有 时 会 有 几 个 出 口 。 当 我 们 
把 流 图 的 边 反 向 时 , 这 些 出 口 就 变 成 了 入 口 。 

















-一 一 一 
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在 类 似 于 活跃 变量 这 样 的 逆向 数据 流 问 题 中 , 我 们 以 深度 优先 排序 的 逆序 来 访问 结 点 。 这 

RE, 我们 可 以 沿 着 路 径 
3—+5 +19 35-1 6-323-345-4104 17 

经 过 一 个 轮 次 把 基本 块 17 中 对 某 个 变量 的 一 次 使 用 逆向 传播 到 IN[4] 。 然 后 在 这 里 等 待 下 一 次 
迭代 ,以 便 把 它 传播 到 0UT[45]。 在 第 二 轮 迭 代 中 , 它 到 达 INL16], 在 第 三 轮 中 它 从 OUT[35 ] 
到 达 OUT[3] 。 

总 的 来 说 , 深度 加 一 次 迭代 足以 把 一 个 变量 的 使 用 沿 着 任何 无 环 路径 逆 向 传递 完毕 。 但 是 ， 
我 们 必须 在 每 次 迭代 中 按照 深度 优先 排序 的 逆序 来 访问 各 个 结 点 , 因为 这 样 才能 在 一 次 迭代 中 
把 变量 的 使 用 沿 着 任意 长 的 下 降 结 点 序列 传递 。 

在 一 些 数 据 流 分 析 问 题 中 , 环形 路 径 不 会 给 分 析 增 加 任何 信息 。 至 今 为 止 讨论 的 界限 是 所 
有 此 类 问题 的 上 界 。 在 一 些 特殊 的 问题 中 ,比如 对 于 支配 结 点 问题 , 迷 代 算法 的 收敛 速度 更 快 。 
在 输入 流 图 是 可 归 约 的 情况 下 , 如 果 以 深度 优先 顺序 访问 各 个 结 点 , 那么 数据 流 算 法 的 第 一 轮 迭 
代 就 可 以 得 到 各 个 结 点 的 支配 结 点 集合 。 如 果 我 们 之 前 不 知道 输入 流 图 是 可 归 约 的 , 那么 我 们 
需要 一 次 额外 的 迭代 来 确定 算法 已 经 收 伍 了 。 
9.6.8 9.6 节 的 练习 

练习 9.6.1: 对 于 网 9-10 PHRMA I 9.1 节 的 练习 ) : 

1) 计算 支配 关系 。 

2) 寻找 每 个 结 点 的 直接 支配 结 点 。 

3) 构造 支配 结 点 树 。 

4) 找 出 该 流 图 的 一 个 深度 优先 排序 。 

5) 根据 问题 4 的 答案 , 指明 其 中 的 前 进 、 后退 和 交叉 边 以 及 树 的 边 。 

6) 这 个 流 图 是 可 归 约 的 吗 ? 

7) 计算 这 个 流 图 的 深度 。 

8) 找 出 这 个 流 图 的 自然 循环 。 

练习 9. 6.2: 对 于 下 列 流 图 重复 练习 9.6. 1。 

1) 图 9-3。 

2) 图 8.9。 

3) 从 练习 8.4.1 得 到 的 流 图 。 

4) 从 练习 8.4.2 得 到 的 流 图 。 

| 练习 9. 6.3: 证 明 下 列 有 关 dom 关系 的 性 质 。 

1) WR a dom b H b dom c, 那么 a dom c( 传 递 性 )。 

2) WR aXb, 那么 a dom b Al b dom 4a 不 可 能 同时 成 立 ( 反 对 称 性 )。 

3) 如 果 a 和 5 是 的 两 个 支配 结 点 , 那么 a dom b 和 8 dom a 之 一 必然 成 立 。 

4) 除了 入 口 结 点 , 每 个 结 点 n 都 有 一 个 唯一 的 直接 支配 结 点 一 一 在 任何 从 入 口 结 点 到 达 n 
的 无 环 路 径 中 , 这 个 支配 结 点 是 离 n 最 近 的 支配 结 点 。 

! 练习 9. 6.4: 图 9-42 是 图 9-38 中 流 图 的 一 个 深度 优先 表示 。 这 个 流 图 有 多 少 个 其 他 的 深 
度 优先 表示 ? 请 记 住 , 不 同 的 子 结 点 顺序 表示 不 同 的 深度 优先 表示 。 

!! 练习 9. 6.5: 证 明 一 个 流 图 是 可 归 约 的 当 且 仅 当 我 们 删除 所 有 回 边 ( 即 头 结 点 支配 尾 结 
点 的 边 ) 后 得 到 的 流 图 是 无 环 的 。 

| 练习 9. 6. 6: 一 个 具有 个 结 点 的 完全 流 图 在 任意 两 个 结 点 i 和 j 之 间 ( 在 两 个 方向 上 ) 都 
有 边 ij, n 取 什 么 值 的 时 候 这 个 完全 流 图 是 可 归 约 的 ? 
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| 练习 9. 6.7: 一 个 在 n 个 结 点 1,2,…,n 上 的 无 环 完全 流 图 对 于 所 有 的 结 点 i 和 j(i< 门 都 
有 边 一 了。 其 中 绪 点 1 是 入 口 结 点 。 

1) n 取 什么 值 的 时 候 这 个 图 是 可 归 约 的 ? 

2) 如 果 给 所 有 的 结 点 i 部 加 上 自 循环 边 ici, 是 否 会 改变 对 问题 a 的 答案 ? 

1 练习 9. 6.8: 一 个 回 边 "一 次 的 自然 循环 被 定义 为 疡 加 上 所 有 能 够 不 经 过 庆 而 直接 到 达 n 
的 结 点 的 集合 。 说 明天 支配 nh 的 自然 循环 中 的 所 有 结 点 。 

! 练习 9. 6.9: 我 们 说 过 , 图 9-45 的 流 图 是 不 可 归 约 的 。 如 果 图 中 的 那些 边 被 替换 为 不 同 
的 路 径 ( 当然 结束 点 除外 ), 且 各 条 路 径 的 结 点 集合 两 两 不 相交 , 那么 得 到 的 流 图 还 是 不 可 归 约 
Ho KRE, 结 点 1 不 一 定 要 是 人 口 结 点 , 它 可 以 是 任何 能 够 从 入 口 结 点 沿 着 某 条 路 径 到 达 的 结 
点 , 只 要 该 条 路 径 的 所 有 中 间 结 点 都 不 是 上 面 明确 给 出 的 四 条 路 径 中 的 一 部 分 。 证 明 上 面 的 论 
述 反 过 来 也 成 立 : 每 个 不 可 归 约 流 图 都 有 一 个 如 下 的 子 图 。 这 个 子 图 和 图 9-45 中 的 流 图 类 似 ， 
只 是 该 流 图 的 边 可 以 被 蔡 换 为 结 点 互 不 相交 的 路 径 , 而 结 点 1 可 以 是 任意 能 够 从 人 口 结 点 经 过 某 
条 不 和 其 他 四 条 路 径 相 交 的 路 径 到 达 的 结 点 。 

1! 练习 9. 6. 10; 说 明 每 个 不 可 归 约 流 图 的 每 个 深度 优先 表示 都 有 一 条 不 是 回 边 的 后 退 边 。 

1! 练习 9. 6. 11: 说 明 如 果 条 件 

fla) Negla) Aa < flg(a)) 
对 于 所 有 的 函数 人 g ME a R, 那么 通用 和 迭代 算法 ， 即 算法 9. 25, 在 按照 深度 优先 排序 执行 每 
次 迭代 时 , 经 过 深度 加 二 次 迭代 之 后 必然 收 伍 。 

! #5) 9.6.12: 找到 一 个 具有 两 棵 不 同 深度 的 DFST 的 不 可 归 约 流 图 。 

| 练习 9. 6. 13: 证 明 下 列 结论 : 

1) 如 果 一 个 定 值 4 在 IN[ BI, 那么 存在 某 条 从 包含 d 的 基本 块 到 达 B 的 无 环 路 径 , 使 得 d 
在 该 路 径 上 的 所 有 IN 和 OUT 值 中 。 

2) 如 果 一 个 表达 式 * + y 在 基本 块 了 的 入 口 处 不 可 用 , 那么 必然 存在 某 条 到 达 B 的 无 环 路 径 
满足 下 面 的 条 件 : 要 么 该 路 径 从 程序 人 口 结 点 开始 并 且 不 包含 任何 杀 死 或 生成 x*+y 的 语句 ; 要 
么 该 路 径 从 一 个 杀 死 了 x+y 的 基本 块 开 始 , 并 且 路 径 中 不 包含 任何 生成 x+y 的 语句 。 

3) WSR x 在 林 本 块 电 的 出 口 处 活跃 , 那么 必然 有 一 条 从 B 到 zx 的 某 个 使 用 点 的 路 径 , 在 该 
路 径 上 没有 对 x 的 定 值 。 


9.7 基于 区 域 的 分 析 


至 今 为 止 我 们 讨论 的 迭代 数据 流 分 析 算 法 只 是 解决 数据 流 问 题 的 方法 之 一 。 接 下 来 我 们 讨 
论 另 一 种 被 称 为 基于 区 域 的 分 析 (region-based analysis) 的 方法 。 回 顾 一 下 ,在 迭代 分 析 方 法 中 ， 
我 们 为 各 个 基本 块 创建 传递 函数 , 然后 通过 在 基本 块 上 进行 反复 扫描 来 寻找 不 动 点 解 。 一 个 基 
于 区 域 的 分 析 技 术 并 不 仅仅 为 各 个 基本 块 创建 传递 函数 , 它 为 越 来 越 大 的 程序 区 域 构造 用 以 措 
述 该 区 域 运行 情况 的 传递 函数 。 最 终 构 造 出 整个 过 程 的 传递 函数 , 并 用 这 个 传递 函数 直接 得 到 
想 要 的 数据 流 值 。 

一 个 使 用 炎 代 算法 的 数据 流 框架 通过 一 个 数据 流 值 的 半 格 和 一 组 对 函数 组 合 运 算 封闭 的 传 
递 函 数 来 描述 , 而 基于 区 域 的 分 析 还 需要 更 多 的 元 素 。 一 个 基于 区 域 的 框架 包括 一 个 数据 流 什 
的 半 格 和 一 个 传递 函数 的 半 格 。 后 一 种 半 格 必须 包括 一 个 交汇 运算 、 一 个 组 合 运算 符 和 一 个 闭 
包 运 算 符 。 我 们 将 在 9. 7. 4 节 看 到 所 有 这 些 元 素 的 作用 。 

基于 区 域 的 分 析 技术 特别 适用 于 那些 包含 环 的 路 径 可 能 改变 数据 流 值 的 数据 流 问题 。 它 的 
闭 包 运算 符 允 许 我 们 概括 描述 一 个 循环 的 运行 效果 , 这 种 方法 比 迭 代 分 析 中 的 方法 更 加 有 效 。 
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APERI LRA EA AY TERETE, A LEEI I EE E RT 
以 和 那些 与 基本 块 相关 联 的 传递 函数 一 样 处 理 。 

为 简单 起 见 , 我 们 在 这 一 节 中 将 只 考虑 前 向 数据 流 问 题 。 我 们 将 首先 通过 大 家 熟知 的 到 达 
定 值 的 例子 来 说 明基 于 区 域 的 分 析 技术 的 工作 原理 。 在 9.8 节 中 ， 当 我 们 研究 归纳 变量 的 时 候 ， 
我 们 将 给 出 一 个 有 关 这 个 技术 的 更 有 说 服 力 的 例子 。 

9.7.1 区 域 

在 基于 区 域 的 分 析 中 , 程序 被 看 作 是 一 个 区 域 (region) 的 层次 结构 。 区 域 (粗略 地 讲 ) 就 是 一 
个 流 图 中 只 具有 单个 人 口 结 点 的 部 分 。 我 们 会 发 现 , 把 代码 看 作 区 域 层 次 结构 的 概念 是 很 直观 
的 , 因为 一 个 基于 块 结构 的 过 程 很 自然 地 被 组 织 成 一 个 区 域 层次 结构 。 在 一 个 块 结构 的 程序 中 ， 
每 个 语句 就 是 一 个 区 域 , 因为 控制 流 只 能 从 一 个 语句 的 开头 进入 。 每 个 语句 向 套 层次 对 应 于 区 
域 层 次 结构 中 的 一 层 。 

正式 地 讲 , 流 图 的 一 个 区 域 是 满足 如 下 条 件 的 一 个 结 点 集 NN 和 边 集 E: 

1) ZEN 中 有 一 个 支配 w 中 所 有 结 点 的 头 结 点 ho 

2) 如 果 某 个 结 点 mm 能 够 不 经 过 到 达 NN 中 的 n, 那么 mm 也 在 NN 中 。 

3) 五 是 所 有 位 于 NN 中 的 任意 两 个 结 点 nl 和 no 之 间 的 控制 流 边 的 集合 。 有 些 进入 h 的 边 (可 
能 ) 不 在 其 中 。 
cea, Gk, 一 个 自然 循环 就 是 一 个 区 域 , 但 是 一 个 区 域 不 一 定 包 含 一 条 回 边 , 也 不 需要 包 
含 任何 环 。 比 如 , 图 9-47 中 的 结 点 Bl MB, 以 及 边 B1 一 Bs 形成 了 一 By) 入 口 基本 所 
个 区 域 ; 结 点 B) By, By 以 及 边 B>B, BoB, 和 Bi 一 *B 也 形成 
一 个 区 域 。 (2) 

HEHA B, By 以 及 边 B>B, 组 成 的 子 图 不 是 一 个 区 域 , 因 / S 

为 控制 流 可 能 从 结 点 By BKB, 进入 这 个 子 图 。 更 准确 地 说 , B, AB 都 ea 

不 支配 男 一 个 结 点 , 因此 违反 了 区 域 定义 中 的 条 件 (1)。 即 使 我 们 “ 选 Gs) 

择 ” 某 个 结 点 (比如 B, ) 作 为 “ 头 结 点 ”, 我 们 还 是 会 违反 条 件 (2), 因为 
我 们 可 以 不 经 过 B, 就 从 B BGA B, 而 Bi 不 在 这 个 “区 域 " 中 。 C 
9.7.2 ”可 归 约 流 图 的 区 域 层次 结构 

在 接 下 来 的 内 容 中 , 我 们 将 假设 流 图 是 可 归 约 的 。 如 果 我 们 偶尔 必须 处 理 不 可 归 约 流 图 的 
话 , 我 们 可 以 使 用 一 种 被 称 为 “ 结 点 分 割 "的 技术 。 该 技术 将 在 9.7. 6 节 中 讨论 。 

为 了 构造 区 域 的 层次 结构 , 我 们 需要 找 出 自然 循环 。 回 顾 一 下 9. 6.6 节 , 在 一 个 可 归 约 流 图 
H, 任何 两 个 自然 循环 要 么 不 相交 , 要 么 一 个 循环 巾 套 在 另 一 个 循环 里 。 在 对 一 个 流 图 进行 “分 
析 ” 并 得 到 它 的 区 域 层次 结构 的 过 程 在 一 开始 的 时 候 把 每 个 基本 块 本 身 看 作 一 个 区 域 。 我 们 把 这 
些 区 域 称 为 叶子 区 域 (leaf region) 。 然 后 , 我 们 把 自然 循环 从 内 到 外 ( 即 从 最 内 层 的 循环 开始 ) 排 
序 。 处 理 一 个 循环 时 , 我 们 用 两 个 步骤 把 整个 循环 替换 为 一 个 结 点 : 

1) 首先 , 循环 的 循环 体 (所 有 的 结 点 以 及 除了 到 达 循 环 头 的 回 边 之 外 的 所 有 边 ) 被 蔡 换 为 
一 个 结 点 ,该 结 点 代表 一 个 区 域 R。 原 先 到 达 工 的 循环 头 的 边 现在 进入 代表 尽 的 结 点 。 从 工 的 任 
意 出 口 结 点 出 发 的 边 被 奉 换 为 从 代表 R 的 结 点 到 达 同 一 个 目标 结 点 的 边 。 但 是 , 如 果 该 边 是 一 
个 回 边 , 那么 它 变 成 了 R 上 的 一 个 圈 。 我 们 把 R 称 为 循环 体 区 域 (body region) o 

2) RE, 我 们 构造 一 个 代表 整个 自然 循环 工 的 区 域 R',R' 称 为 一 个 循环 区 域 (loop region) o 
R 和 R' 之 间 的 唯一 区 别 在 于 后 者 包含 了 到 达 上 的 循环 头 的 回 边 。 换 名 话说 , 在 流 图 中 用 R' 蔡 换 R 
时 , Fe AA RA R 到 其 自身 的 边 。 























图 9-47 区域 的 例子 
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我 们 按照 这 个 方法 不 断 进行 处 理 ， 把 越 来 越 大 的 循环 替换 成 为 单个 结 点 。 在 处 理 时 先 把 循 

环 埠 换 成 为 带 有 圈 的 结 点 ， 再 蔡 换 成 为 不 带 圈 的 结 点 。 因 为 可 归 约 流 图 中 的 循环 要 么 相互 揪 套 ， 
要 么 相互 不 相交 , 所 以 在 按照 这 个 归 约 过 程 构造 得 到 的 -系列 流 图 中 , 循环 区 域 结 点 可 以 表示 对 
应 的 自然 循环 的 所 有 结 点 。 

各 个 自然 循环 最 终 都 会 归 约 成 为 单一 的 结 点 。 此 时 ,要 么 这 个 流 图 被 归 约 为 单个 结 点 ; 要 么 
还 有 多 个 结 点 但 是 不 包含 循环 , 即 归 约 得 到 的 流 图 是 一 个 包含 多 个 结 点 的 无 环 图 。 在 前 一 种 情 
WE, 我 们 已 经 完成 了 对 区 域 层次 结构 的 构造 ; 而 在 后 一 种 情况 下 , 我 们 需要 为 整个 流 图 再 构造 

一 个 循环 体 区 域 。 
Ree 考虑 图 9-48a 中 的 控制 流 图 。 在 这 个 流 图 中 有 一 条 从 Bs 到 B 的 回 边 。 相 应 的 区 域 
层次 结构 在 图 9-48b 中 显示 , 图 中 显示 的 边 是 区 域 流 图 的 边 。 图 中 总 共有 8 个 区 域 : 











d: i = m-1 B, (ENTRY) 
di jan 
(h: a= ul 





























B 5 (EXIT) 











a) ids A A OF HE b) 它 的 区 域 层次 结构 
图 9-48 例 9.51 的 控制 流 图 
1) KR, +, Rs 是 叶子 区 域 , 分 别 代表 了 基本 块 B, 到 Bs。 oa 


出 口 基本 块 。 
2) 循环 体 区 域 R 表示 流 图 中 唯一 循环 的 循环 体 。 它 由 区 
BR. Ry 和 Rs 组 成 , 并 包括 了 三 个 区 域 之 间 的 边 : B>B, 











Bs 一 Bs 和 Bs 一 Bs。 这 个 区 域 有 两 个 基本 块 : 53 和 B4 ， 因 为 
它们 有 不 包含 在 区 域内 的 、 离 开 它 们 的 边 。 图 9-49a 显示 了 把 
Re 归 约 为 一 个 结 点 之 后 得 到 的 流 图 。 请 注意 ,虽然 边 Ra 一 R5 9 CT D EMIA T 
和 Rs 一 Rs 都 被 替换 为 边 Re 一 Rs ， 记 住 Re 一 Rs 实际 上 代表 了 
两 条 原来 的 边 是 很 重要 的 。 因 为 我 们 最 终 要 沿 着 这 条 边 传播 。 图 9 49 把 图 9-48 的 流 图 
传递 函数 ,所 以 需要 记 住 从 B RB, 出 发 的 传递 函数 将 到 达 。 归 约 为 单个 区 域 的 步骤 
R; 的 头 结 点 
3) 循环 区 域 民 RIAA. EST TERM, 和 一条 回 边 BB。 它 也 有 两 个 
出 口 结 点 , 仍然 是 B3 和 Bs。 图 9-49b 中 显示 了 把 整个 自然 循环 归 约 为 Rj 之 后 得 到 的 流 图 。 
4) 最 后 ， oe en 
By, ByB; 和 Bs 一 B;。 当 我 们 把 流 图 归 约 为 Rs 的 时 候 , 它 就 变 成 单个 结 点 。 因 为 没有 回 边 到 达 
的 头 结 点 Bi ， 因 此 不 需要 再 执行 一 个 最 后 的 步骤 , 把 这 个 区 域 Rs 归 约 成 为 一 个 循环 区 域 。 0 
我 们 用 下 面 的 算法 来 概括 按照 层次 结构 分 解 一 个 可 归 约 流 图 的 过 程 。 
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构造 一 个 可 归 约 流 图 的 自 底 向 上 的 区 域 序列 。 

输入 : 一 个 可 归 约 流 图 Co 

输出 : 6 的 区 域 的 列表 , 该 列表 可 用 于 基于 区 域 的 数据 流 问题 。 

方法 : 

1) 一 开始 ,列表 中 以 某 种 顺序 包含 了 由 C 的 各 个 基本 块 组 成 的 所 有 叶子 区 域 。 

2) 不 断 选择 满足 如 下 条 件 的 自然 循环 L: 如 果 工 中 包含 了 其 他 的 自然 循环 , 那么 这 些 被 包含 
的 循环 对 应 的 循环 体 区 域 和 循环 区 域 已 经 被 加 和 人 到 列表 中 。 首 先 把 由 工 的 循环 体 ( 即 循环 过 中 除 
了 到 达 区 的 循环 头 的 各 条 回 边 之 外 的 其 余部 分 ) 组 成 的 区 域 加 和 人 到 列表 中 , 然后 再 加 入 上 的 循环 
XE o l 

3) 如 果 整 个 流 图 本 身 不 是 一 个 自然 循环 , 在 列表 的 最 后 加 入 由 整个 流 图 组 成 的 区 域 。 C 








为 什么 叫做 “可 归 约 的 ” 

现在 我 们 可 以 知道 可 归 约 流 图 得 名 的 原因 了 。 虽 然 我 们 不 会 证 明 下 面 的 性 质 , 但 本 书 中 
用 涉及 流 图 的 回 边 来 定义 的 “可 归 约 流 图 ”和 其 他 几 个 按照 能 否 把 一 个 流 图 机 械 地 归 约 成 一 
个 结 点 的 定义 方式 实际 上 是 等 价 的 。 在 9.7.2 节 中 搞 述 的 把 自然 循环 埋 缩 成 为 一 个 结 点 的 过 
程 是 上 述 机 械 化 归 约 过 程 的 一 种 。 可 归 约 流 图 的 另 一 个 有 趣 的 定义 是 可 以 按照 下 列 方法 被 归 
约 成 为 一 个 结 点 的 所 有 流 图 : 

T: 删除 从 一 个 结 点 到 达 自 身 的 边 。 
| To: 如 果 结 点 上 有 唯一 的 前 驱 m, E nn 不 是 流 图 的 入 口 结 点 ,那么 把 m 和 合并。 




















9.7.3 基于 区 域 的 分 析 技 术 概述 

WEEP RMR URES R PAF RRR, 我 们 计算 一 个 传递 函数 fr ny ee) RAISE R A 
BAAR MAT BY R HATRET REPRE SET. WRF TEAM KR R PFE AR HR B 
到 达 尺 之 外 的 基本 块 的 边 , RIIA B Æ R WYP th  RAR(exit block), FAL R PAG 
个 出 口 基本 块 如 计算 一 个 传递 函数 , IDA fr, ourego AAE RAE T ATE R PM RIA 
口 基本 块 到 达 B 的 出 口 处 的 所 有 可 能 路 径 的 执行 效果 。 

然后 我 们 沿 着 这 个 区 域 层次 结构 逐步 向 上 , 为 越 来 越 大 的 区 域 计 算 传 递 函 数 。 我 们 从 由 单 
个 基本 块 组 成 的 区 域 开始 。 对 于 任何 一 个 这 样 的 区 域 8, fg, ta] 就 是 一 个 单元 函数 ， 而 
fa, our181 则 是 基本 块 B 自身 的 传递 函数 。 当 我 们 沿 着 层次 结构 向 上 时 ， 

。 如 果 忍 是 一 个 体 区 域 , 那么 属于 R 的 边 构 成 了 R 的 子 区 域 的 一 个 无 环 图 。 我 们 可 以 按照 

子 区 域 的 拓扑 排序 计算 传递 函数 。 

o MRR E— MEME, 那么 我 们 只 需要 考虑 到 达 届 的 头 结 点 的 回 边 的 效果 。 

最 终 我 们 必然 会 到 达 层 次 结构 的 顶部 , 并 计算 得 到 对 应 于 整个 流 图 的 区 域 R, 的 传递 函数 。 
在 算法 9. 53 中 描述 了 计算 过 程 。 

下 一 步 是 计算 各 个 基本 块 的 入 口 和 出 口 处 的 数据 流 值 。 我 们 按照 相反 的 方向 ,， 从 区 域 R, 开 
台 沿 着 层次 结构 向 下 处 理 各 个 区 域 。 对 于 每 个 区 域 , 我 们 计算 其 人 口 处 的 数据 流 值 。 对 于 区 域 
Rao BAN BLA fr, wer] (IN[ENTRY] ) 来 计算 R, 的 子 区 域 尺 的 入口 处 的 数据 流 值 。 我 们 重复 这 
个 过 程 , 直到 到 达 位 于 区 域 层次 结构 中 的 叶子 上 的 基本 块 为 止 。 
9.7.4 有 关 传递 函数 的 必要 假设 

为 了 使 得 基于 区 域 的 分 析 能 够 解决 问题 , 我 们 要 对 框架 中 的 传递 函数 集合 的 人 性质 作出 某 些 
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假设 。 明 确 地 说 , 我们 需要 作用 于 传递 国 数 之 上 的 三 个 基本 原子 运算 : 组 合 、 交 汇 运算 和 闭 包 运 
算 。 使 用 迭代 算法 的 数据 流 框架 只 需要 其 中 的 第 一 个 运算 。 
AS 
LP REI AI PT URREA A A BS GE, OL, A 是 结 点 
ny 和 ns AYER BRL. PAT ni 再 执行 m ARRI AAR of, KER. PAA ATED. 2.2 
节 中 讨论 过 , FFA 9.2.4 节 中 用 到 达 定 值 给 出 了 一 个 例子 。 为 了 回顾 一 下 , + gen; 和 kill, Æ f 
的 gen Al kill SB. ABA 
Jo ot, (*) = gen, U ( (gen, U (x — kill, ) ) - kill, ) 
= (gen, U (gen, —kill,)) U (x -— (kill, U kill, ) ) 
因此 , fh of, 的 gen il kill WASIJE (gen U (gen, — kill, ) ) MC kill, U kill)。 对 于 所 有 具有 gen- 
kil FZ CAS (38 PHA , EAB ITA). ATE OY 1 R RE AR eA], 但 是 
我 们 必须 单独 考虑 各 种 情况 。 
交汇 运算 : 
这 里 , 传递 函数 集合 本 身 就 是 一 个 具有 交汇 运算 Ar 的 半 格 的 值 域 。 两 个 传递 函数 让 AL 的 
交 , BA Ash, BELA NAO) SAED Aha), 其 中 人 是 数据 流 值 的 交汇 运算 。 传 递 函 
数 上 的 交汇 运算 用 来 把 具有 相同 结尾 点 的 不 同 执行 路 径 的 执行 效果 组 合 起 来 。 从 现在 开始 , 在 
不 会 引起 攻 义 时 我 们 把 传递 函数 的 交汇 运算 也 写成 A。 对 于 到 达 定 值 框架 , 我 们 有 
a AR) a) =A l) A hla) 
= (gen, U (x — kill, ) ) U (gen, U (x — kill, ) ) 
= (gen, Ugen) U(x- (kill, N kill, ) ) 
也 就 是 说 , fi1 AN 的 gez 和 kil RANIJE gen, Ugen, F kill; N kilo PRALER BRHF, 
对 于 任何 gen-kill 形式 的 传递 函数 集合 都 可 以 进行 同样 的 处 理 。 
闭 包 
如 果 j 表示 一 个 环 的 传递 函数 , 那么 f" 表示 沿 着 这 个 环 执行 二 次 的 效果 。 当 不 知道 迭代 次 
数 的 时 候 , 我 们 必须 假设 这 个 环 将 被 执行 0 到 多 次 。 我 们 用 /*, 即 太 的 闭 包 来 表示 这 样 的 循环 的 
传递 函数 。 闭 包 f* 的 定义 如 下 
ft sN 
请 注意 , /? 必须 是 单元 传递 函数 ,因为 它 代表 把 这 个 循环 执行 0 次 的 效果 ， 即 从 入 口 处 开始 但 不 
运行 的 效果 。 如 果 令 7 表示 单元 传递 函数 , 那么 可 以 把 上 式 写成 
pe SINANI 
假设 在 一 个 到 达 定 值 框架 中 的 传递 函数 /有 一 个 gen 集 和 一 个 kill 集 。 那 么 ， 
户 (z) =(Y@)) i 
=genU ((genU (x -— kill) ) ~ kill) 
= gen U (x — kill) 
P(x) =f? (x)) 
=genU (x — kill) 
以 此 类 推 , BARIS” 都 是 genU (x-kil), th, WRA RRA gen-kill 形式 , 那么 沿 
着 一 个 循环 执行 的 次 数 对 该 函数 设 有 影响 。 因 此 ， 
f° (x) SIA (x) Af? (%) Av 
=xU (genU (x— kill) ) 
= genUx 
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也 就 是 说 , 传递 函数 /* 的 gen 和 hill 集合 分 别 是 gen AO. 直观 地 讲 ， 因 为 我 们 可 能 根本 不 沿 着 
这 个 循环 执行 , x 中 的 任何 元 素 都 可 以 到 达 这 个 循环 的 人 口 处 。 在 此 后 的 所 有 选 代 中 , 到达 定 值 
中 总 是 包括 所 有 在 gen 集合 中 的 元 率 。 
9.7.5 一 个 基于 区 域 的 分 析 算 法 

下 面 的 算法 根据 某 个 满足 9. 7. 4 节 中 假设 的 框架 , 解决 了 一 个 可 归 约 流 图 上 的 前 向 数据 流 分 
析 问 题 。 回 顾 一 下 , fg, cri AS, our[81 是 两 个 传递 沙 数 ,它们 把 区 域 且 的 入 口 点 上 的 数据 流 值 
分 别 转换 为 在 子 区 域 R' 入 口 处 和 出 口 基 本 块 B 的 出 口 处 的 数据 流 值 。 


基于 区 域 的 分 析 。 

输入 : 一 个 具有 9.7.4 节 中 所 列 性 质 的 数据 流 枢 架 和 一 个 可 愉 约 流 图 Co 

输出 : 6 中 的 每 个 基本 块 有 的 数据 流 值 IN[ B). 

方法 : 

1) 使 用 算法 9. 52 来 构造 6 的 自 底 向 上 的 区 域 序列 , 假设 它们 是 Ri, Ra, es Rao EPR, 是 
最 顶层 的 区 域 。 

2) 进行 自 底 向 上 的 分 析 , 计算 概括 了 每 个 区 域 的 执行 效果 的 传递 函数 。 对 于 按照 自 底 向 上 
顺序 排列 的 每 个 区 域 Ri , Roy, RR,， 进 行 下 列 计算 : 

@ 如 果 尺 是 一 个 对 应 于 基本 块 B 的 叶子 区 域 , S Se nig =L SR, oute] =f8。 其 中 , fy 是 基 
AR B AER A 

O 如 果 丸 是 一 个 循环 体 区 域 ,执行 图 9-5$0a 中 的 计算 。 

© 如 果 民 是 一 个 循环 区 域 ， 执行 图 9-50b 中 的 计算 。 

3) 进行 自 顶 向 下 的 扫描 ,， 找 出 各 个 区 域 开始 处 的 数据 流 值 。 

@ IN[R,] = IN[ ENTRY]. 

© 按照 自 顶 向 下 的 顺序 , XIR, Ro ，…，R，1 | PRENER RHH 

INIR] =fr, mpri (INLR']) 

其 中 REAREA KE RAKE 





1) for (按照 拓扑 排 序 ， 对 于 每 个 直接 包含 于 R 


的 子 区 域 S) { 
2) Frans = À gjss sate RIHRYRIJE B ÍROUTIB]; 
/* MES ZRIRRGAA, BA fR,IN[S] 就 是 
对 空 集 应 用 交汇 运算 的 结果 ， 也 就 是 单元 函数 */ 
3) for (S 中 的 每 个 出 口 基 本 块 B) 
4) fROUTIB] = fs,ourts) ° ÍRIN(S) 
= 





a) 构造 一 个 循环 体 区 域 的 传递 函数 





1) ” 令 5 为 直接 包含 于 岂 的 循环 体 区 域 ， 就 是 说 5 就 是 从 民 中 
删除 了 到 达 呈 的 头 结 点 的 回 边 后 得 到 的 区 域 

) faints) = (AS tkt AE REINI BIS OUTE) ; 

) for (RR 中 的 每 个 出 口 ERAB ) 

4) fROUTIB]) = Jsourlal ° FRINIs]i 


Co ko 











b) 为 一 个 循环 区 域 R' 构 造 传递 函数 


图 9-50 ”基于 区 域 的 数据 流 计算 的 细节 
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让 我 们 首先 看 一 下 算法 中 自 底 向 上 分 析 过 程 的 工作 细节 。 在 图 9-500 的 第 (1) 行 中 , 我 们 按 
照 某 个 拓扑 排序 访问 一 个 循环 体 区 域 的 各 个 子 区 域 。 第 (2) 行 中 计算 的 传递 函数 代表 了 所 有 从 R 
的 头 结 点 到 S 的 头 结 点 的 可 能 路 径 的 执行 效果 ; 第 (3) 和 (4) 行 中 计算 的 传递 函数 代表 了 所 有 从 
RR 的 头 结 点 到 RR 的 出 口 点 ( 即 所 有 的 某 个 后 继 在 5 之 外 的 基本 块 的 出 口 点 ) 的 可 能 路 径 的 执行 效 
果 。 请 注意 , 按照 第 (1) 行 所 构造 的 拓扑 排序 , R 的 所 有 前 驱 8' 必 然 在 S 之 前 的 区 域 中 。 这 样 ， 
fr, ouri8' 一 定 已 经 在 算法 的 外 层 循环 的 前 面 某 次 迭代 中 由 第 (4) 行 计算 完毕 。 

对 于 循环 区 域 , 我 们 执行 图 9-50b 中 第 (1) 到 (4) 行 的 各 个 步骤 。 其 中 , 第 (2) 行 计算 了 沿 着 
循环 体 区 域 $ 重复 执行 零 次 或 多 次 的 效果 。 第 (3) 和 第 (4) 行 计算 了 进行 一 次 或 多 次 迭代 之 后 在 
循环 出 口 处 的 效果 。 

在 算法 的 自 顶 向 下 扫描 中 , 步骤 3(a) 首 先 把 问题 的 边界 条 件 作为 最 顶层 区 域 的 输入 。 然 后 , 如 
RR ARS FR, RAT AEE BB 六 ,nm 应 用 到 IN[R'] 就 可 以 计算 得 到 IN[R]。 O 
让 我 们 应 用 算法 9. 53 来 寻找 图 9-48a 中 流 图 的 到 达 定 值 。 第 一 步 构造 出 自 底 向 上 访 
问 各 个 区 域 的 顺序 ; 这 个 顺序 将 作为 各 个 区 域 的 下 标 ， 比如 R, Ra, s Ryo 

五 个 基本 块 的 gen 集 和 kill 和 集 的 值 概括 如 下 : 


B, B, B; B, 
Idi, dy, dz} {d4} tds | {de} 














(d4, ds, de} {di} | d; | | dy} 


请 回忆 一 下 9.7.4 节 中 对 gen-kill EKA HY I BIRLI ; 
o 要 计算 传递 函数 的 交汇 , 只 要 计算 gen 集合 的 并 集 和 hill 集合 的 交集 。 
。 组 合 传 递 函 数 时 , 计算 两 个 函数 的 gen 集 的 并 集 和 kill 集 的 并 集 。 但 是 这 个 规则 有 一 个 例 
外 ， 当 一 个 表达 式 被 第 一 个 函数 生成 且 没 有 被 第 二 个 函数 生成 , 同时 又 被 第 二 个 函数 杀 
死 的 时 候 , 这 个 表达 式 不 在 最 后 的 gen 中 。 
。 在 计算 一 个 传递 函数 的 闭 包 时 , 保持 原来 的 gen RA, 但 是 用 80 蔡 代 原来 的 hill 集合 。 
前 面 的 五 个 区 域 R ，…， Rs 分 别 是 基本 块 Bi ,…, B;。 对 于 1<i<5, fp, tw[8,] 都 是 单元 函 
3, Jr, out[8,] 是 Bi 的 传递 函数 : 
fB,, outta) (x) = (x — killg,) U geng, 
算法 9.53 的 第 二 步 构造 的 其 他 传递 函数 如 图 9-51 中 。 区 域 Re 由 区 域 R,、R; MR, 组 成 ， 
Re 代表 该 循环 的 循环 体 , 因此 不 包含 回 边 B4 一 8,。 对 这 些 区 域 的 处 理 顺序 就 是 它们 的 唯一 的 拓 
扑 排序 : R,、R3、Rs。 首 先 请 记 住 边 84 一 8 到 达 了 Re 之 外 ,Rs 在 Re 中 没有 前 驱 。 因 此 
fr nin EARRAS, M Sr, ovre Æ Bo 本 身 的 传递 函数 。 
区 域 B 的 头 结 点 有 一 个 Re 中 的 前 驱 , BIR, 。 到 达 它 的 人 口 处 的 传递 函数 就 是 到 达 Bs 出 口 
处 的 传递 函数 fn，ourn[B,]。 这 个 函数 已 经 被 计算 出 来 。 我 们 把 这 个 函数 和 8; 的 传递 函数 组 合 
起 来 , 计算 出 到 达 B, 出 口 处 的 传递 函数 。B, 就 在 由 它 自身 组 成 的 区 域 中 。 
最 后 , AA B, MB, 都 是 Rs 的 头 结 点 B4 的 前 驱 , 对 于 到 达 Ra 入 口 处 的 传递 函数 ,我们 必 
须 计算 





O 严格 地 讲 , RANAH Sre mi 但 是 对 类 似 于 R 这 样 的 单 基本 块 区 域 , 如 果 我 们 在 这 个 上 下 文 环境 下 使 用 基 
本 块 名 字 而 不 是 区 域名 字 的 话 ,文字 表述 通常 会 更 清楚 。 


Neg 
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: eee 一 
__ 传递 函数 gen kil | 

Re | fr, INR =I 6 9 

Íre OUTE) = fra, OUT[B2}° fg INIR {da} {di} 
Íra AN Rg = Fg, OUT Ba] {ds} {di} 
frsOUTIas! = fry, OUT UB! ° fre INIR {d4; ds} {d1, da} 
Fre IN(Ra = fro, OUTIB2) ^ fro, OUTiBa) | {44,45} {di} 
Fre OUT Ba = fa, OUT B4) 9 Íra INIRA {ds, ds, de} {di,d2} 

Ry fre in Re = Fra OUT Ba {da,ds, de} 8 
Ír; OUT Bs = Frag OUT (Bs) o fry IN{Ro {da, ds, do} {d;,d3} 
fr, OUT {Bs = Íre OUT{Ba) O fry IN[R6} {da,ds, de} {di,d2} 

Rs Frs IN Ry =I 8 0 
frs.OUTIB)] = fry OUT BY {di,dz,ds} {da, ds, de} 
Íra INIR; = frg OUTID {d1 d2, da} {ds, ds, de} 
Fre OUT(Bs) = Ír, OUTiBa) ° frg INIR) {d2, da, ds, do} {di, ds} 
frg,OUT(Bs) = frz.OUT Ba] ° fre INIR) {d3,d4,ds, ds} {di, d2} 
Fre Nin = fre OUT {Bs ^ frg,0UT D4) | {dz, da, ds, ds,do} | {di} 
fre OUT[Bs) = frs, OUT Hs] ° js INI Rs) {d2,ds,da,ds,do} | {di} 








图 9-51 使 用 基于 区 域 的 流 分 析 计 算 图 9-48a 中 流 图 的 传递 函数 


JR OUTLB;] AJR, urls] 
这 个 传递 函数 和 传递 函数 fr, oote FAA, 得 到 我 们 想 要 的 函数 J oure) WER, EW, dz 
没有 在 这 个 函数 中 被 杀 死 ， 因 为 路 径 8, 一 Bs 没有 对 变量 a 重新 定 值 。 
现在 考虑 德 环 区 域 Rj。 它 只 包含 一 个 表示 它 的 循环 体 的 区 域 Re。 因为 只 有 一 个 到 达 Re 的 
头 结 点 的 回 边 By 一 B, , 代表 这 个 循环 体 执 行 0 次 或 者 多 次 的 传递 函数 就 是 大 ,ourt8,]: 这 个 函数 
的 gen 集合 是 1ds, ds, dg], 而 /这 集合 是 全 KERR 有 两 个 出 口 , MIERA B, Bz. Ak, 这 
个 传递 函数 和 Ro 的 各 个 传递 函数 相 组 合 ,， 得 到 对 应 于 R 的 传递 函数 。 请 注意 某 些 定 值 ， 比 如 
ds, 是 怎样 因为 路 径 B, 一 Bs 一 B, 一 B3， EERI B,-B8,-B8, 8, 8, 的 原 央 而 被 加 入 到 函数 
Jr, outta, HY gen 集中 去 的 。 
最 后 考虑 区 域 Rs ， 即 整个 流 图 。 它 的 子 区 域 是 Rl、R; 和 Rs。 我 们 将 按照 这 个 拓扑 顺序 考虑 
这 些 子 区 域 。 和 前 面 一 样 ,传递 浮 数 fk,, mrsi] 是 一 个 单元 函数 ,而 传递 前 数 fe, ourt a, | 是 
fr ,ouT[B,]， 也 就 是 fp o 
R, 的 头 结 点 B 只 有 一 个 前 驱 B ,因此 到 达 它 的 入 日 的 传递 函数 就 是 Re 中 从 B1 离开 的 传 
递 函 数 。 我 们 把 fk oure) F R 中 到 达 B, 和 Bs 出 口 处 的 传递 函数 相 组 合 , 得 到 它们 在 Re 中 相 
应 的 传递 函数 。 最 后 我 们 考虑 R, 它 的 头 结 点 Bs 在 Rs 中 有 两 个 前 驱 , B B, 和 B, Ae, 我 们 
计算 fk outta] Afr, ouT[B,] 可 以 得 到 fr, miego HARRI Bs 的 传递 函数 是 单元 函数 ,因此 
Fre, OUT[ B; } =fr, IN{ Bs] ° 
第 三 步 根据 传递 函数 计算 实际 的 到 达 定 值 。 存 步骤 3(a), IN[ Re ] =1， 因 为 在 程序 的 开头 没 
有 到 达 定 值 。 图 9-52 显示 了 步骤 3(b) 是 如 何 计算 其 余 的 数据 流 值 的 。 这 个 步 台 从 Rs 的 各 个 子 
区 域 开始 。 因 为 从 Rs 的 开始 处 到 它 的 各 个 子 区 域 开始 处 的 传递 函数 已 经 计算 出 来 了 , 通过 简单 
地 应 用 这 些 传递 函数 就 可 以 找到 各 个 子 区 域 的 开始 处 的 数据 流 值 。 我 们 重复 这 个 步 又 ,直到 得 
到 各 个 叶子 区 域 的 数据 流 值 为 止 。 这 些 叶 子 区 域 就 是 各 个 基本 块 。 请 注意 , 图 9-52 中 显示 的 数 
据 流 值 和 我 们 对 相同 流 图 应 用 迭代 数据 流 分 析 技 术 而 得 到 的 值 是 完全 一 致 的 。 当 然 , 这 两 组 值 
必须 一 致 。 
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IN[ Rs] = @ 

IN[a} = Srani CNR] = 0 

IN[Rz] = frainpraN[Rs]) =  {di.do,ds} 

IN[Rs] = frewnjrs)(N[Rs]) = {de,ds,ds,ds, de} 
TN[Re] = fre aNnprejGN[R7]) = {di,ds, d3, d4, ds, de} 
IN[Ra] = fryilNn(IN[Rel) = {de,d3,d4,ds,d6} 
IN[Rs] = frRoINIRJON[Re]) = {d2, dz, da, ds, de} 
IN[Ro] = fre anpey(N[Re]) = {d1,d2, dz, ds,ds, do} 








图 9-52 ”基于 区 域 的 流 分 析 的 最 后 一 步 


9.7.6 处 理 不 可 归 约 流 

如 果 预 计 到 需要 用 编译 器 或 其 他 程序 处 理 软件 进行 处 理 的 程序 中 经 常会 有 不 可 归 约 流 图 ， 
那么 我 们 建议 使 用 迭代 算法 ， 而 不 是 基于 层次 结构 的 方法 来 解决 数据 流 分 析 问 题 。 但 是 ,如 果 我 
们 只 准备 偶尔 处 理 一 下 不 可 归 约 流 图 , 那么 使 用 下 面 的 “ 结 点 分 割 " 技术 就 足够 了 。 

首先 尽 可 能 依据 自然 循环 构造 区 域 。 如 果 流 图 是 不 可 归 约 的 , 我 们 会 发 现 得 到 的 流 图 包含 
环 , 但 是 没有 回 边 , 因此 我 们 不 能 进一步 对 这 个 流 图 进行 分 析 。 在 图 9-53a 中 显示 了 一 种 典型 的 
情形 。 这 个 流 图 和 图 9-45 中 的 不 可 归 约 流 图 具有 同样 的 结构 , 但 是 就 像 图 9-53 中 的 结 点 内 的 小 
结 点 所 显示 的 , 这 个 流 图 的 结 点 可 能 实际 上 是 一 个 复杂 的 区 域 。 

我 们 选取 一 个 具有 多 个 前 驱 , 且 不 是 整个 流 图 的 头 结 点 的 区 域 RR。 如 果 RR 有 个 前 驱 ， 那么 
建立 个 对 应 于 RR 的 整个 流 图 的 拷贝 ,并 将 RR 的 头 结 点 的 个 前 驱 分 别 连 接 到 不 同 的 拷贝 。 请 记 
È, 只 有 一 个 区 域 的 头 才 可 能 具有 区 域 之 外 的 前 驱 。 我 们 只 是 给 出 (而 不 准备 证 明 ) 下 面 的 结论 : 
这 样 的 结 点 分 割 的 结果 是 , 在 寻找 新 的 回 边 并 构造 出 这 些 回 边 的 区 域 之 后 ,区域 的 个 数 至 少 减少 
了 一 。 这 样 得 到 的 流 图 可 能 还 是 不 可 归 约 的 , 但 是 我 们 可 以 不 断交 蔡 进 行 两 个 步骤 : 结 点 分 割 步 
TR; 寻找 新 自然 循环 并 将 其 塌 缩 为 单个 结 点 的 步 又。 最 终 我 们 会 得 到 单个 区 域 , 即 流 图 已 经 被 完 
全 归 约 。 








a) 


图 9-53 ”复制 一 个 区 域 使 得 一 个 不 可 归 约 流 图 变 成 可 归 约 的 


图 9-53b 中 显示 的 结 点 分 割 把 边 RaR 变 成 了 一 个 回 边 , 因为 现在 R, EE Ra A 
此 这 两 个 区 域 可 以 合 二 为 一 。 得 到 的 三 个 区 域 一 Ri 、Ry。 及 新 产生 的 区 域 一 -组 成 了 一 个 新 的 
无 环 的 流 图 , 因此 可 能 被 组 合 到 单个 循环 体 区 域 中 。 这 样 我 们 就 把 整个 流 图 归 约 为 单个 区 域 。 
一 般 来 讲 , 可 能 还 需要 更 多 的 分 割 处 理 , 在 最 坏 的 情况 下 , 最 后 得 到 的 基本 块 的 个 数 可 能 和 原 流 
图 中 基本 块 的 个 数 成 指数 关系 。 o 
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我 们 想 要 的 是 针对 原 流 图 的 答案 。 因 此 我 们 还 必须 考虑 对 分 割 所 得 流 图 的 数据 流 分 析 结 果 
和 这 个 答案 之 间 的 关系 。 我 们 可 以 考虑 两 个 方法 : 

1) 分 割 区 域 可 能 有 益 于 优化 过 程 , 我 们 可 以 简单 地 修订 这 个 流 图 使 得 只 有 某 些 基本 块 被 复 
制 。 到 达 每 个 基本 块 副本 的 路 径 可 能 只 是 到 达 原 基本 块 的 路 径 的 一 个 子 集 。 因 此 相对 于 原 基 本 
块 上 的 数据 流 值 而 言 , 在 这 些 基 本 块 副 本 上 的 数据 流 值 可 能 包含 更 加 精确 的 信息 。 比 如 , 到 达 每 
个 基本 块 副本 的 定 值 要 少 于 到 达 诛 基本 块 的 定 值 。 

2) 如 果 我 们 希望 不 是 真 的 分 割 而 是 想 保 留 原 来 的 流 图 , 那么 在 分 析 完 分 割 所 得 的 流 图 之 后 ， 
我 们 可 以 查看 每 个 被 分 割 基 本 块 B, 以 及 它 对 应 的 拷贝 集合 By, Boy, Bro RAIT AS IN 
[B] =INLBj] AIN[B,] A- AIN[B,;], 并 且 类 似 地 计算 OUT 值 。 

9.7.7 9.7 节 的 练习 

练习 9.7.1: 对 于 图 9-10 的 流 图 ( 见 9.1 节 中 的 练习 ) : 

1) 寻找 所 有 可 能 的 区 域 。 但 是 你 可 以 忽略 区 域 列表 中 那些 只 有 一 个 结 点 且 没 有 边 的 区 域 。 

2) 给 出 算法 9. 52 所 构造 的 伐 套 区 域 的 集合 。 

3) 按照 9.7.2 节 中 “为 什么 叫做 可 归 约 的 ”部 分 中 所 描述 的 方法 , 给 出 该 流 图 的 一 个 7) - 7, 


归 约 。 
练习 9.7.2: 在 下 列 流 图 上 重复 练习 9.7.1: 
1) 图 93。 
2) 图 839。 


3) 你 在 练习 8.4. 1 中 得 到 的 流 图 。 

A) 你 在 练习 8.4.2 中 得 到 的 流 图 。 

练习 9.7.3; 证 明 每 个 自然 循环 都 是 一 个 区 域 。 

1) 练习 9.7. 4: 说 明 一 个 流 图 是 可 归 约 的 当 且 仅 当 它 可 以 按照 下 列 方式 被 转化 成 为 单一 
结 点 : 

1) 9.7.2 节 的 “为 什么 叫做 可 归 约 的 ”部 分 中 描述 的 AT, 运算 。 

2) 9.7.2 节 中 引入 的 区 域 定义 。 

| 练习 9. 7.5; 说 明 如 果 你 对 一 个 不 可 归 约 流 图 应 用 结 点 分 割 技术 , 然后 对 分 割 后 得 到 的 流 
图 进行 T, - 7 归 约 ， 你 最 后 得 到 的 流 图 的 结 点 一 定 严格 少 于 原 流 图 的 结 点 数目 。 

! 练习 9. 7. 6: 如 果 你 交替 地 使 用 结 点 分 割 技 术 和 T - 7 归 约 来 归 约 一 个 具有 个 结 点 的 
完全 有 向 图 , 会 发 生 什么 情况 ? 


9.8 符号 分 析 


在 本 节 中 , 我 们 将 使 用 符号 分 析 来 说 明基 于 区 域 的 分 析 技 术 的 使 用 。 在 这 个 分 析 中 , 我 们 用 
符号 表示 的 方式 跟踪 程序 中 的 变量 的 值 , 把 这 些 变量 的 值 表示 为 关于 








输入 变量 及 其 他 变量 的 表达 式 。 我 们 把 这 些 变量 称 为 参考 变量 。 用 同 |3 7 imeseOs 
一 组 参考 变量 来 表示 变量 的 值 可 以 托 绘 出 这 些 变量 之 问 的 关系 。 符 号 | pea 
分 析 可 以 被 用 于 多 种 目的 ,比如 优化 、 并行 化 和 用 于 程序 理解 的 分 析 。 | 4 oa 
RS 考研 图 9-54 中 的 简单 程序 的 例子 。 这 里 我 们 使 用 4 作为 叭 ”| PP 








一 的 参考 变量 。 符 号 分 析 会 发 现在 第 2 行 和 第 3 行 中 分 别 对 y 和 z 赋 
值 的 语句 执行 之 后 , y 和 z 的 值 分 别 是 x -1 和 % -2。 这 个 信息 是 很 有 图 9-54 说 明 符号 分 析 
用 的 。 比 如 , 可 以 用 来 确定 在 第 4 行 和 第 5 行 中 的 赋值 语句 将 会 在 不 动机 的 一 个 例子 程序 
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同 的 内 存 位 置 上 进行 写 运 算 , 因而 是 可 以 并 行 执行 的 。 并 且 , 我 们 还 可 以 指出 条 件 z >x 永远 不 
可 能 为 真 ,从 而 允许 优化 程序 把 第 6 行 和 第 7 行 的 条 件 语句 全 部 删除 。 口 
9.8.1 参考 变量 的 仿 射 表达 式 

因为 我 们 不 可 能 为 所 有 计算 得 到 的 值 创建 一 种 简洁 而 又 封闭 的 符号 表达 式 ， 所 以 选择 了 一 - 
个 抽象 域 , 并 且 使 用 域 中 的 最 精确 的 表达 式 来 近似 表达 计算 结果 。 在 此 之 前 我 们 已 经 看 到 了 这 
个 策略 的 一 个 例子 : 常量 传播 。 在 常量 传播 中 , 我 们 的 抽象 域 由 所 有 常量 值 和 特殊 符号 UNDEF 
及 NAC 组 成 。 其 中 ,UNDEF 表示 我 们 尚未 决定 该 值 是 否 为 常量 ,而 当 已 经 发 现 一 个 变量 不 是 常 
量 的 时 候 使 用 NAC. 

我 们 在 这 里 给 出 的 符号 化 分 析 技 术 尽 可 能 地 把 值 表 示 成 为 参考 变量 的 仿 射 表达 式 。 如 果 一 
个 关于 变量 ww , 0g, 0+, va 的 表达 式 可 以 被 表示 为 co + clol +… teo, 那么 这 个 表达 式 就 是 仿 射 
的 , 其 中 co, c, o, en 都 是 常量 。 这 样 的 表达 式 也 被 非 正 式 地 称 为 线性 表达 式 。 严 格 地 讲 ， 只 
AH co =O 的 时 候 , 仿 射 表达 式 才 是 线性 的 。 我 们 对 仿 射 表达 式 感 兴趣 的 原因 是 循环 中 的 数组 下 
标 经 常 可 以 表示 成 仿 射 表达 式 一 一 这 些 信息 可 用 于 优化 和 并 行 化 处 理 。 在 第 11 章 中 , 我 们 将 更 
详细 地 讨论 这 个 主题 。 

归纳 变量 

一 个 仿 射 表达 式 不 一 定 只 能 使 用 程序 变量 作为 参考 变量 , 它 也 可 以 使 用 一 个 循环 的 迭代 次 
数 作 为 参考 变量 。 如 果 一 个 变量 在 某 个 程序 点 上 的 值 能 够 被 表示 为 cji + co, 其 中 i 是 包含 该 程序 
点 的 最 内 层 循环 的 迭代 次 数 , 那么 这 个 变量 称 为 归纳 变量 (inducetion variable) 。 
ASA 考虑 代码 片断 


for (m = 10; m < 20; m++) 
{ x = m*3; Alx] = 0; } 


假设 我 们 为 该 循环 引入 一 个 变量 i 来 表示 已 执行 的 迭代 次 数 。 在 循环 第 一 次 迭代 时 ,i 的 值 是 0， 
第 二 次 迭代 的 时 候 的 值 是 1, 以 此 类 推 。 我 们 可 以 把 变量 m 表示 成 为 i 的 一 个 仿 射 表达 式 , 也 
就 是 m=i+10。 变 量 x, 也 就 是 3m, 在 循环 的 连续 迁 代 中 的 取 值 是 30, 33，…, 57。 因 此 * 具有 
仿 射 表 达 式 *=30 +3i。 我们 说 m 和 x 都 是 这 个 循环 的 归纳 变量 。 口 

把 变量 表示 成 为 循环 次 数 的 仿 射 表 达 式 使 得 我 们 可 以 直接 计算 该 变量 在 各 次 迭代 中 的 值 ， 
而 且 能 够 实现 多 种 代码 转换 。 一 个 归纳 变量 在 循环 的 各 次 迭代 中 所 取 的 值 可 以 通过 加 法 运算 ， 
而 不 是 乘法 运算 计算 得 到 。 这 个 转换 称 为 “强度 消减 ”。 它 已 经 在 8.7 节 和 9. 1 节 中 介绍 过 了 。 
比如 , 我 们 可 以 从 例 9. 57 的 循环 中 消除 乘法 运算 x=m*3，, 只 要 把 程序 改写 为 : 


x = 27; 
for (m = 10; m < 20; m++) 
{ x = x+3; A[x] = 0; } 


另外 , 请 注意 在 该 循环 中 被 赋予 0 值 的 内 存 位 置 ， 即 &4 430, BA + 33，…，&4 + 57， 也 都 是 
循环 迁 代 次 数 的 仿 射 表达 式 。 实 际 上 , 这 些 整 数值 是 该 循环 中 唯一 需要 进行 计算 的 值 ; 我 们 只 需 
要 保留 普 或 < 中 的 一 个 。 上 面 的 代码 可 以 直接 昔 换 为 下 面 的 代码 ; 


for (x = &A+30; x <= &A457; x = x+3) 
xx = 0; 


除了 加 快 计算 速度 ， 符 号 化 分 析 对 于 实现 并 行 化 也 是 有 用 的 。 当 循环 中 的 数组 下 标 是 循环 
迭代 次 数 的 仿 射 表达 式 时 ,我 们 可 以 考虑 不 同 迁 代 中 的 数据 访问 的 关系 。 比 如 , 我 们 可 以 指出 在 
每 次 迭代 中 被 写 人 的 内 存 位 置 是 不 同 的 ,因此 循环 的 全 部 迭代 可 以 在 不 同 的 处 理 器 上 并 行 执行。 
这 样 的 信息 在 第 10 章 和 第 11 章 中 被 用 来 从 顺序 程序 中 抽取 并 行 性 。 

其 他 参考 变量 

如 果 一 个 变量 不 是 我 们 已 选取 的 参考 变量 的 线性 函数 ,我 们 还 可 以 选择 把 它 的 值 当 作 将 来 
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进行 的 运算 的 参考 变量 。 比 如 , 考虑 下 面 的 代码 片段 : 


a= f(); 
b =a + 10; 
c=at 11 
虽然 在 上 面 的 函数 调用 之 后 a 的 值 本 身 不 能 被 表示 成 任何 参考 变量 的 线性 函数 , 但 它 仍 可 以 被 


用 作 后 继 语 句 的 参考 变量 。 比 如 ,使 用 a 作为 参考 变量 , 我 们 就 可 以 发 现在 程序 的 结尾 处 HE b 
大 1。 

CR 本 向 中 多 次 使 用 的 例子 是 基于 图 9-55 中 显示 的 源 代码 的 。 其 中 的 内 层 循环 和 外 层 特 
环 是 很 容易 理解 的 , 因为 除了 在 for 循环 的 头 部 , f 
Hg 的 值 都 没有 被 改变 。 因 此 有 可 能 把 f 和 g E 
为 分 别 对 外 层 和 内 层 循环 的 迭代 次 数 进行 计数 的 参 
考 变量 i 和 j。 也 就 是 说 , 我 们 可 以 令 f=i+99 和 gg 
=j+9, 然后 把 /和 8& 完全 蔡 换 掉 。 在 翻译 成 中 间 
代码 时 ,我 们 可 以 利用 每 个 循环 至 少 会 迭代 一 次 的 
信息 , 把 对 i<100 和 j<10 的 测试 推迟 到 循环 的 尾 } 
部 进行 。 在 图 9-55 的 代码 中 引入 i 和 j, 并 把 for 循 : 
环 当 作 repeat 循环 处 理 之 后 ,就 可 以 得 到 如 图 9-56 图 9-55 例 9.58 的 源 代 码 
中 显示 的 流 图 。 





a= 0; 
for (f = 100; f < 200; f++) { 


de Co Wo 一 


< 20; g++) { 
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19-56 $i 9. 58 的 流 图 和 它 的 区 域 层次 结构 

可 以 发 现 , a, b, cI d 都 是 归纳 变量 。 在 代码 的 每 一行 上 赋 给 这 些 变量 的 值 的 序列 被 显示 
在 图 9-57 中 。 我 们 将 看 到 , 我 们 可 以 找 出 用 参考 变量 i 和 j 表示 的 这 些 变量 的 仿 射 表达 式 。 它 们 
E, 在 第 4 行 的 a=i, 第 7 行 的 d=10i+j-1 和 第 8 行 的 c=j。 口 
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1<i<100 
了 = 1 ,10 





















3 | a i 100 

4 | b 10i 1000 

7/14 ,7 ,29 | 10i,---,10i+9] 1000,---, 1009 
8 |e 1,10 1,--+,10 | 127+, 10 











图 9-57 fill 9. 58 中 的 各 个 程序 点 上 看 到 的 值 的 序列 


9. 8.2 数据 流 问 题 的 公式 化 

这 个 分 析 寻 找 关于 某 些 参考 变量 的 仿 射 表达 式 。 这 些 参考 变量 包括 (1) 用 于 对 各 个 循环 所 执 
行 的 迭代 进行 计数 的 参考 变量 ,(2) 在 必要 时 存放 区 域 人 口 处 的 值 的 参考 变量 。 这 个 分 析 也 可 以 
找到 归纳 变量 、 循 环 不 变 表达 式 以 及 常量 。 这 里 常量 可 以 看 作 是 仿 射 表达 式 的 退化 情况 。 请 注 
意 , 这 个 分 析 不 能 够 找到 所 有 的 常量 , 因为 它 只 跟踪 参考 变量 的 表达 式 。 

数据 流 值 : 符号 化 映射 

这 个 分 析 使 用 的 数据 流 值 的 域 是 符号 化 映射 ， 它 是 将 程序 中 的 变量 映射 到 值 的 函数 。 这 个 
值 可 以 是 一 个 参考 值 的 仿 射 函数 或 者 表示 非 仿 射 表达 式 的 特殊 符号 NAA。 如 果 只 有 一 个 变量 ， 
那么 相应 半 格 的 底 元 素 值 就 是 一 个 把 该 变量 映射 为 NAA 的 映射 。n 个 变量 的 半 格 就 是 各 个 变量 
的 半 格 的 积 。 我 们 使 用 mNAA 来 表示 这 个 半 格 的 底 元 素 , 它 把 所 有 变量 都 映射 为 NAA。 就 像 在 党 
量 传播 中 所 做 的 那样 , 我们 可 以 把 顶层 数据 流 值 定义 为 把 所 有 变量 都 映射 为 一 个 未 知 值 的 符号 
化 映射 。 但 是 , 在 基于 区 域 的 分 析 中 我 们 不 需要 顶 元 素 的 值 。 
图 9-58 显示 了 例 9. 58 的 代码 中 和 各 = fm mO me ni 
个 基本 块 关联 的 符号 化 映射 。 我 们 将 在 稍 后 看 到 “| ouria| 0 | naa | WAX | waa 


如 何 发 现 这 些 映射 , 它们 是 在 图 9-56 的 流 图 上 进 IN[B2] |7—1] NAA | NAA NAA 



















































ouT|Bo i 102 0 A 

行 基于 区 域 的 数据 流 分 析 的 结果 。 IN a i 10 |j-1 any 
和 程序 人 人 口 相 关联 的 符号 化 映射 是 Myo Met ae ; eet 
E B, 的 出 口 处 , a 的 值 被 设置 为 0。 在 B, 的 人 [Ba] |i 10i-10| j |10+7-11 





口 处 , 在 第 一 次 迭代 时 a 的 值 是 0, 然后 在 每 一 


图 9-58 9.58 中 的 程序 的 符号 化 映射 
次 外 层 循环 的 选 代 中 都 增加 一 。 因 此 , 在 进入 第 Pet 





i 次 迭代 时 其 值 为 上 - 1, 在 迭代 结束 时 为 i。 因 为 Dicesi; | 
EE b, c d 在 外 层 循环 人 口 处 的 值 未 知 , 所 以 | For Gat A nod 

E B, 入 口 处 的 符号 化 映射 把 6、c、d 映射 到 | = o; 

NAA。 到 现在 为 止 , CATER (ee je 
BRU. TE By 出 口 处 的 符号 化 映射 反映 了 该 。 “| 7) a = 108 + j =t 
基本 块 中 对 a、b Ac 赋值 的 语句 的 运行 效果 。 HPT 

他 的 符号 化 映射 可 以 用 类 似 的 方法 推导 得 到 。 一 ) 








旦 我 们 确认 图 9-58 中 的 映射 是 有 效 的 , 就 可 以 把 
图 9-55 中 对 a、5、c Ald 的 赋值 替换 为 适当 的 仿 
射 表达 式 。 也 就 是 说 , 我 们 可 以 把 图 9-55 替换 为 
图 9-59 中 的 代码 。 

单个 语句 的 传递 函数 

这 个 数据 流 问题 中 的 传递 函数 根据 符号 化 映射 计算 得 到 新 的 符号 化 映射 。 为 了 计算 一 个 赋 
值 语句 的 传递 函数 , 我 们 解释 该 语句 的 语义 , 并 决定 被 赋值 的 变量 能 否 被 表示 为 赋值 语句 右边 的 


图 9-59 将 图 9-55 的 代码 中 的 赋值 语句 替换 为 
关于 参考 变 最 上 和 /的 仿 射 表达 式 之 后 的 代码 
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值 的 仿 射 表达 式 。 所 有 其 他 变量 的 值 保持 不 变 。 
一 个 语句 s 的 传递 函数 记 为 人 , 其 定义 如 下 : 
1) 如 果 * 不 是 一 个 赋值 语句 , 那么 人 就 是 一 个 单元 滑 数 。 
2) WR s 是 一 个 对 x 赋值 的 语句 , 那么 


m(v) 对 于 所 有 的 变量 vex 
co + erm(y) +com(z) WR x 被 峰值 为 co + cy +e, 
f,(m) (x) = (cl =0, RH m(y) #NAA), 并且 
(cs =0, 或 者 m(z) #NAA) 
NAA 否则 
其 中 表达 式 co + cim(y) + cam(z) 用 来 表示 所 有 可 能 出 现在 对 x 赋值 的 语句 的 右 部 、 关 于 变量 


y 


FN 2 的 各 种 形式 的 表达 式 。 这 些 表 达 式 向 x 赋予 的 值 是 变量 之 前 的 值 的 一 次 仿 射 变换 的 结果 。 这 
些 表达 式 是 co, co +y, co -y,y+z,xz-y， csy 和 (el)。 请 注意 , EREA F, co. c 和 


co 中 的 一 个 或 者 多 个 的 值 为 0。 





PHBA co Hcg = Oc, = 1/5, 口 


EMG 如 采 议 赋 信 语 句 是 x =y +2, 那么 co =0 而 c -cs = 1。 如 果 该 赋值 表 达 式 是 x =y /5， 





关于 值 映射 上 的 传递 函数 的 注意 事项 
我 们 定义 符号 化 映射 上 的 传递 函数 的 方法 中 有 一 个 微妙 之 处 ， 即 可 以 选择 不 同 的 方式 来 
表示 一 个 计算 的 效果 。 如 果 m 是 一 个 传递 函数 的 输入 映射 ,那么 m (x) 实际 上 表示 的 是 "变量 
x 在 人 口 处 可 能 具有 的 任何 值 "。 我 们 努力 尝试 把 该 传递 函数 的 结果 表示 为 输入 映射 中 用 到 
的 参考 变量 的 仿 射 表达 式 。 





fm) ,结果 是 一 个 映射 。 因 为 映射 也 是 函数 , 随后 我 们 可 以 把 它 应 用 于 一 个 变量 x 并 得 到 一 
个 值 。 





你 应 该 知道 对 f(m) (x) 这样 的 表达 式 的 正确 解释 , 其 中 f 是 一 个 传递 函数 , m 是 一 个 映 | 
射 , 而 x 是 一 个 变量 。 按 照 数学 上 的 约定 , 我 们 从 左边 开始 应 用 函数 , 也 就 是 说 我 们 首先 计算 | 








传递 函数 的 组 合 
Sf Alf, 是 两 个 以 其 输入 映射 m 来 定义 的 传递 函数 。 为 了 计算 及 。 有 ,我 们 把 的 定义 中 


的 m(z;) 的 值 蔡 换 为 fh(m) (wi) 的 定义 。 我 们 把 所 有 对 NAA 的 运算 都 蔡 换 为 NAA。 也 就 是 : 
1) WSR A, (m)(v) =NAA, BAA fi) COn) (v) =NAA。 
2) MAR (m)(v) =co + 了 icim(vi) ,那么 

NAA WSR XT FRE 140, c; 40 Bf, (m) (v;) =NAA 


2°f;)(m)(v) = 
ALONE EI 





例 9. 58 HP AYA SHES Be A 18 BB BT WA Si ESE A We E a BL AO 


计算 得 到 。 这 些 传 递 函 数 在 图 9-60 中 定义 。 
数据 流 问 题 的 解决 方法 





口 


我 们 使 用 IN;;[ B3 ] 和 OUT, ;[ Bs ] 来 表示 在 内 层 循环 的 第 / 次 迁 代 和 外 层 循环 的 第 ;次 选 代 
时 基本 块 By 的 输入 和 输出 数据 流 值 。 对 于 其 他 的 基本 块 , 我 们 使 用 IN;[ Bi ] 和 OUT;[ Bi ] 来 表示 
在 外 层 循环 的 第 i 次 迭代 时 的 相应 数据 流 值 。 我 们 还 可 以 看 到 , 图 9-58 中 显示 的 符号 化 映射 满 


足 传递 函数 给 出 的 约束 。 这 些 约束 在 图 9-61 中 列 出 。 
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= ———— š ouT[Be] = fa(IN[BK])， 对 所 有 的 Bk 
f | fone) | Fo | fne | fm) our[B] = IN, [Be] 
fz, | 0 m(b) m(c) m(d) OuTi[B2] > mya[B3], 1<7<10 
fp, | m(a) +1 | 10m(a) +10 | 0 m(d) OUTij- [B3] = INij[Bal), 1<i<100,2<j<10 
fa, | ma) m(b) mc) + 1 | m(b) + me) OUT: 10/B3] > 1N,[By), 2<i <100 
fx, | mla) m(b) m(e) m(d) |  outy-1[Bs] 三 1N,[Bo], 1<i<100 
图 9-60 例 9.58 的 传递 函数 图 9-61 赃 春 循环 的 每 次 迭代 上 满足 的 约束 


第 一 个 约束 说 明 , 一 个 基本 块 的 输出 映射 是 通过 把 基本 块 的 传递 函数 应 用 到 输入 映射 上 而 
得 到 的 。 其 余 的 约束 说 明 , 在 程序 执行 的 时 候 ,一 个 基本 块 的 输出 映射 必须 大 于 或 等 于 后 继 基本 
块 的 输入 映射 。 

请 注意 , 我 们 的 迭代 数据 流 算法 不 能 给 出 上 面 的 解 ， 因 为 它 无 法 用 已 执行 的 迭代 次 数 来 表达 
数据 流 值 。 正 如 我 们 将 在 下 一 节 看 到 的 , 可 以 用 基于 区 域 的 分 析 来 找 出 这 样 的 解 。 
9. 8.3 基于 区 域 的 符号 化 分 析 

我 们 可 以 把 9.7 节 中 描述 的 基于 区 域 的 分 析 技 术 进 行 扩 展 , 用 以 寻找 一 个 循环 的 第 i 次 迭代 
中 各 个 变量 的 表达 式 。 和 其 他 基于 区 域 的 算法 一 样 , 一 个 基于 区 域 的 符号 化 分 析 也 有 一 个 自 底 
向 上 的 处 理 过 程 和 一 个 身 顶 向 下 的 处 理 过 程 。 这 个 自 底 向 上 的 处 理 过 程 用 一 个 传递 函数 来 概括 
一 个 区 域 的 执行 效果 。 这 个 传递 函数 把 人 口 处 的 符号 化 映射 转变 为 出 口 处 的 输出 符号 化 映射 。 
在 自 顶 向 下 的 处 理 过 程 中 , 符号 化 映射 的 值 被 向 下 传播 到 内 层 区 域 。 

不 同 之 处 在 于 我 们 处 理 循 环 的 方法 。 在 9.7 节 , 循环 的 效果 是 用 财 包 运算 来 概括 的 。 
给 定 一 个 其 循环 体 传递 函数 为 的 循环 , f 的 闭 包 f* 被 定义 为 在 任意 多 次 应 用 /可 能 产生 的 
所 有 效果 之 上 无 穷 多 次 应 用 交汇 运算 而 得 到 的 结果 。 但 是 , 为 了 找到 一 个 归纳 变量 , 我 们 
需要 确定 一 个 变量 的 值 是 否 为 至 今 已 执行 的 迭代 次 数 的 仿 射 函数 。 相 应 的 符号 化 映射 必须 
把 正在 执行 的 迭代 的 序号 作为 参数 。 不 仅 如 此 ,只 要 我 们 知道 一 个 循环 执行 迭代 的 总 次 数 ， 
就 可 以 使 用 这 个 数字 来 找到 循环 之 后 归纳 变量 的 值 。 比 如 , 在 例 9. 58 中 我 们 断定 在 执行 了 
SikiEnSA, a 的 值 是 i。 因为 循环 共有 100 次 迭代 , 在 循环 结束 的 时 候 a 的 值 一 定 
是 100, 

接 下 来 , 我 们 首先 定义 基本 运算 符 : 用 于 符号 化 分 析 的 传递 函数 的 交汇 运算 和 组 合 运算 。 然 
后 说 明 如 何 使 用 它们 进行 基于 区 域 的 归纳 变量 分 析 。 

传递 函数 的 交汇 运算 

当 计 算 两 个 函数 的 交 时 , 除非 两 个 函数 把 一 个 变量 映射 成 为 同一 个 不 是 NAA 的 值 , 这 个 变 
HEB NAA, Alt 


Mad Cm) (0) =f 


带 参 数 的 函数 组 合 

为 了 把 一 个 变量 表示 成 为 一 个 关于 循环 下 标的 仿 射 函数 , 我 们 要 计算 出 将 某 个 函数 组 合 给 
定 多 次 后 的 效果 。 如 果 一 次 迭代 的 效果 可 以 用 一 个 传递 函数 /概括 , 那么 对 某 个 ;站 SO, 执行 i 次 
迭代 的 效果 记 为 广 。 请 注意 , 当 i=0 时 , fi =f* =1 是 一 个 单元 函数 。 

程序 中 的 变量 可 以 分 成 四 种 类 型 : 

1) 如 果 f(m) (x) =m(x) +0, 其 中 c 是 一 个 常数 , 那么 对 于 所 有 的 i=0, fi(m) (x) = m(x) 
+ci。 如 果 一 个 循环 的 循环 体 可 以 用 传递 函数 表示, 我 们 说 x 是 这 个 循环 的 一 个 基本 归纳 变量 


(basic induction variable) 。 











fin) æ) ”如 果 fi(m)(v) =f (m) (2) 
NAA 否则 
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2) MAR fCm) (x) =m(x), IRAN -F MAW i SO, fi Cm) (x) =m(x)。 变量 x 没有 被 改变 。 
如 果 循环 的 循环 体 具有 传递 函数 ,那么 x 的 值 在 循环 的 任意 多 次 迭代 结束 之 后 依然 保持 不 变 。 
我 们 说 x 是 该 循环 的 符号 化 常量 ( symbolic constant) 。 

3) WR f(m) (x) =co temai) + +e, m(x,), 其 中 每 个 < 要 么 是 基本 归纳 变量 , BAR 
符号 化 常量 , 那么 对 于 i>0,， 有 

f'(m) (x) =co te, fi(m) (x) +7 te, f (m) (x,) 

我 们 说 x* 虽然 不 是 基本 归纳 变量 , 但 它 依然 是 一 个 归纳 变量 。 请 注意 , 上 述 公 式 对 于 i=0 不 
成 立 。 

E EAT NAA, 

要 得 到 执行 固定 多 次 迭代 的 效果 , FAT A EE LAY i ER EAN AT. Ett 
ia 在 最 后 一 次 迭代 开始 时 变量 的 值 由 f* 给 出 。 在 这 种 情况 下 ,其 值 仍然 可 以 用 仿 射 
函数 表示 的 变量 只 有 那些 循环 不 变 变 量 。 
m(v) 如 果 f(m)(v) =m(v) 
PT a 否则 

ETRE 对 于 例 9. 58 的 最 内 层 循 环 , 执行 i(i>0) 次 迄 代 的 效果 由 传递 函数 诺 , 描述。 根据/ 
的 定义 , 我 们 看 到 a 和 4 是 符号 化 常量 。 因 为 在 每 次 迭代 中 增加 一 ,所 以 它 是 一 个 基本 归纳 变 
量 。 因 为 4 是 符号 化 常量 和 基本 归纳 变量 。 的 仿 射 函 数 ， 所 以 它 是 一 个 归纳 变量 。 由 此 可 得 ， 








m(a) 如 果 v=a 
_ jm(?) 如 果 w=6 
J m(c) +i WR vse 


m(b)+m(c) +i WME vad 
如 果 我 们 不 能 指出 基本 块 B PRIA EOR, 那么 就 不 能 使 用 广 , 而 必须 使 用 f/* 来 表示 在 
循环 结束 时 的 条 件 。 此 时 我 们 有 
m(a) WMR v =a 
m(b) 如 果 v=p 
NAA WUE vac 
NAA 如 果 v=d 


Sr, (m)(v) = 


一 个 基于 区 域 的 算法 
基于 区 域 的 符号 化 分 析 。 

输入 : 一 个 可 归 约 的 流 图 Co 

输出 : G 的 每 个 基本 块 B 的 符号 化 映射 IN[ BI. 

方法 : 我 们 对 算法 9. 53 做 出 如 下 的 修改 。 

1) 我 们 改变 了 为 一 个 循环 区 域 构造 传递 函数 的 方法 。 在 原来 的 算法 中 , 我 们 使 用 传递 函数 
fr tNis] 来 把 循环 区 域 R&R 入口 处 的 符号 化 映射 变换 为 经 过 未 知 多 次 迭代 之 后 位 于 循环 体 5 的 人 口 
处 的 符号 化 映射 。 如 图 9-50b Was, 这 个 函数 被 定义 为 代表 了 所 有 回 到 循环 入 口 处 的 路 径 的 传递 
函数 的 闭 包 。 在 这 里 , 我 们 定义 4. ;tnts] 来 表示 从 循环 区 域 人 口 处 开始 直到 第 i 次 达 代 的 入 口 
处 的 执行 效果 。 内 此 ， 


fi ; = i-l 
R, i, IN[S $ 
3] A ina Ss OUIL ) 


2) 如 果 一 个 区 域 的 迭代 次 数 已 知 , 该 区 域 的 执行 效果 的 描述 是 把 上 面 定义 中 的 i 蔡 换 为 实 
际 兴 代 次 数 。 
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3) 在 算法 的 自 项 向 下 处 理 过 程 中 , 我 们 计算 fn, i mwts1 就 可 以 找 出 与 一 个 循环 的 第 i 次 迭代 
的 入 口 处 相关 的 符号 化 映射 。 

4) 如 果 一 个 变量 的 输入 值 m(zw) 被 区 域 R 中 的 某 个 符号 化 映射 的 右 部 使 用 , 并 且 在 该 区 域 的 
入 口 处 m(v) = NAA, 则 我 们 引入 一 个 新 的 参考 变量 1, 在 区 域 R 的 开始 处 加 上 赋值 语句 t =v, 并 
且 所 有 对 m(v) 的 引用 都 被 替换 为 :。 如 果 我 们 不 在 























被 传递 到 内 层 循环 。 g sh s ; 
CE 对 于 例 9. 58, 我 们 在 图 9-62 中 显示 了 该 frina = I 
EFA DASA ANAESTH ARR EENE | ooun aun efa 
中 被 计算 出 来 的 。 区 域 Rs 是 内 层 循 环 ， 它 的 循环 体 
是 Bs. HARM RRs WA OAAR JGS) E frina = fR OUTIB) 
代 开始 处 的 路 径 的 传递 函数 是 5、 ; 表示 到 达 第 j 次 ÍR LOUTI = fho,OUTIB) 
迭代 结尾 处 的 路 径 的 传递 函数 是 fh o fran = I 
区 域 Re HAA B, 和 Bs 以 及 它们 之 间 的 特 fae ees a 
ARR Rs AK, MB, 和 Rs 的 人 口 处 开始 的 传递 jnsouUTIB] = frz,100,00T Ho fB, 








函数 可 以 用 原 算法 中 的 同样 方法 来 计算 。 因 为 户 , 是 图 9.62 例 9 58 的 自 底 向 上 处 理 

一 个 单元 函数 ,所 以 传递 函数 frR, oura] KIR T 过 程 中 的 传递 函数 的 关系 

本 块 B, 和 整个 内 层 循环 的 执行 效果 的 组 合 。 因 为 

已 知 内 层 循环 将 迭代 K, 所 以 我 们 可 以 把 j 蔡 换 为 10 来 精确 描述 内 层 循环 的 执行 效果 。 其 余 
的 传递 函数 可 以 用 类 似 的 方式 计算 得 到 。 计 算得 到 的 实际 传递 晴 数 显示 在 图 9-63 中 。 












































了 f(m)(a) f(m) (0) Fm) f(m) lad) 

ÍRs j,1N[Bs) m(a) m(b mic) +7- 1| NAA 

fg j,OUTIB;] | m(a) m(b) mie) +7 m(b) + m(c)+ 
j—1 

Fg IN(139] m(a) m(b) mlc) m(d) 

ÍRE AN[Rs) m{a) +1 10m(a)+10 | 0 m{d) 

fre OUT[Ba) | mla) +1 10m(a) +10 | 10 10m(a) + 9 

ÍR; i IN[Re] m(a)+i-—1]| NAA NAA NAA 

Ín- ioute] | Ma) +i 10m(a) + 10i | 10 10m(a)+ 
102 + 9 

Íre, INB] mla) m(b) mic) m(d 

ÍR AN[R:] 0 m(b) m(c) m(d) 

fra OUT{By) | 100 1000 10 1009 





FA 9-63 在 例 9.58 的 自 底 向 上 处 理 过 程 中 计算 得 到 的 传递 函数 


在 程序 和 人 如 处 的 符号 化 映射 就 是 mya 。 我 们 使 用 自 项 问 下 处 理 过 程 来 计算 到 达 逐 层 柑 套 的 
区 域 的 入 口 处 的 符号 化 映射 直到 我 们 得 到 了 所 有 基本 块 的 符号 化 映射 为 止 。 一 开始 的 时 候 我 
们 首先 计算 区 域 Rs 中 的 基本 块 B 的 数据 流 值 : 
IN(B,] =mNAA 

OUT[ B, ] =fg, (INL B, J) 

再 向 下 到 达 区 域 性 和 Rs, 我 们 得 到 
IN;[ B2] =fr, i, mtr) (OUTL B' }) 

OUT;[ By] =fg, (IN;[ B, ]) 

最 后 , 在 区 域 Rs 中 我 们 得 到 
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jl Bad =fr,.). inte, } COUT; 8, }) 
ee _j{ 83] =fe, ON; [Bs }) 
毫 不 奇怪 ， 。 - 生 的 就 是 我 们 在 图 9-58 中 显示 的 结果 。 = 
例 9.58 显示 了 一 个 简单 的 程序 ,其 中 的 各 个 符号 CST 
er EAA 一 个 仿 射 表达 式 。 我 们 使 用 |D a -= input0; 
例 9.65 来 说 明 为 什么 以 及 如 何在 算法 9.63 中 引信 参 Ja MEGS 4 F< Or sey a 
































考 变量 。 5) ‘ = g + a 
ARE 考虑 图 9-64a PH BAT. OF 为 描述 a aR 
内 层 循环 迭代 j 次 的 执行 效果 的 传递 函数 。 即使 a 的 
值 可 能 在 该 循环 的 执行 中 上 下 变动 , 我 们 看 到 2 是 一 a) 变量 4 存 其 中 上 下 变动 的 一 个 循环 
个 基于 a 在 此 循环 的 人 口 处 的 取 值 的 归纳 变量 。 也 就 SR 
是 说 , f;(m)(b) =m(a) -1+j。 内 为 a 被 赋予 了 一 个 C 
输入 值 , 所 以 在 内 层 循环 和信 口 处 的 符号 化 映射 把 a Be et ee 
射 为 NAA。 我 们 在 该 人 口 处 引信 一 个 新 的 参考 变量 : 
来 保存 a 的 值 , 并 像 图 9-64b 中 那样 进行 奉 换 。 DSt 
9.8.4 9.8 节 的 练习 
练习 9. 8. 1: 对 于 图 9-10 中 的 流 图 ( 见 9.1 节 的 练 D 参考 变 遇 1 使 得 6 RI — VW 
J), 给 出 下 列 基 本 块 的 传递 函数 。 
1) 基本 块 B,。 图 9-64 引入 参 考 变 量 的 需求 
2) 基本 块 B4。 
3) 基本 块 B;。 


练习 9. 8. 2: 考虑 图 9-10 中 由 基本 块 B, AB, ARM ARM. WR i 表示 了 该 循环 的 迭代 
执行 次 数 , 而 /是 从 该 循环 的 入 口 ( 即 Bs 的 开始 处 ) 到 Bs 的 出 口 处 的 循环 体 ( 即 不 包含 Bs 到 B, 
的 边 ) 的 传递 消 数 , 那么 广 是 什么 ? 请 记 住 , 把 一 个 映射 m 作为 参数 , 而 m AEE a, b, d, ep 
的 每 一 个 赋予 一 个 值 。 昌 然 我 们 不 知道 这 些 变量 的 值 , 但 是 我 们 用 m(a) 等 来 表示 它们 。 

| 练习 9. 8. 3: 现在 考虑 图 9-10 中 由 B, B3, Ba, Bs 组 成 的 外 层 循环 。 令 g 为 循环 的 人 口 
处 By 到 它 的 出 口 处 Bs 的 循环 体 的 传递 函数 。 令 i 表示 由 Bs 和 B, 组 成 的 内 层 循 环 的 迭代 次 数 
《我 们 无 法 知道 迭代 的 具体 次 数 ), 并 令 j 表示 外 层 循 环 的 迭代 次 数 (我 们 还 是 无 法 知道 和 迭代 的 具 
体 次 数 )。 那 么 g 是 什么 ? 


9.9 第 9 章 总 结 


e 全 局 公共 子 表达 式 : 一 个 重要 的 优化 方法 是 寻找 同一 个 表达 式 在 两 个 不 同 基 本 块 中 的 计 
算 过 程 。 如 果 一 个 在 另 一 个 前 面 , 我 们 可 以 把 第 一 次 计算 该 表达 式 时 得 到 的 结果 存放 起 
K, 并 在 再 次 计算 该 表达 式 时 使 用 这 个 结 

o 复制 传播 : 一 个 复制 语句 w=v 把 一 个 变量 。 赋值 给 另 一 个 变量 uo 在 有 些 情况 下 , 我 们 可 
以 把 所 有 对 的 使 用 替换 为 对 " 的 使 用 , 从 而 消除 这 个 赋值 语句 以 及 变量 uo 

o 代码 移动 : 另 一 种 优化 方法 是 把 一 个 计算 过 程 移动 到 它 所 在 的 循环 之 外 。 只 有 当 循 环 的 
每 次 近代 中 这 个 计算 过 程 都 生成 同样 的 信 , 这 种 改变 才 是 正确 的 。 

e 归纳 变量 ; 很 多 循环 都 有 归纳 变量 。 这 些 变量 在 循环 执行 时 的 不 同 选 代 中 的 取 值 是 一 
线性 序列 。 有 些 归纳 变量 仅仅 用 于 对 迭代 进行 计数 ,它们 经 常 可 以 被 消除 ,从 而 降低 了 
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循环 的 一 次 迭代 所 需要 的 时 间 。 
数据 流 分 析 : 一 个 数据 流 分 析 模 式 在 程序 的 每 个 点 上 痢 定 义 了 -个 值 。 程 序 的 各 个 语句 
都 有 相关 联 的 传递 函数 。 这 些 函数 给 出 了 一 个 语句 之 前 和 之 后 的 数据 流 值 之 问 的 关系 。 
具有 多 个 前 驱 的 语句 的 值 是 它 的 各 个 前 驱 的 值 的 组 合 。 这 个 组 全 通过 交汇 (或 者 说 汇流 ) 
函数 计算 得 到 。 

基本 块 的 数据 流 分 析 : 因为 数据 流 值 在 一 个 基本 块 内 的 传播 过 程 通常 很 简单 , 所 以 数据 
流 方程 通常 给 每 个 基本 块 设置 两 个 值 , 称 为 IN 值 和 OUT 值 。 这 两 个 值 分 别 表示 该 基本 
块 在 开始 处 和 结尾 处 的 数据 流 值 。 把 基本 块 中 各 个 语句 的 传递 函数 组 合 起 来 就 可 以 得 到 
代表 整个 基本 块 的 传递 函数 。 

到 达 定 值 : 到 达 定 值 数据 流 框架 的 数据 流 值 是 程序 中 的 语句 的 集合 。 这 些 语 名 给 一 个 或 者 
多 个 变量 定 值 。 如 果 一 个 变量 肯定 在 一 个 基本 块 内 被 重新 定 值 , 那么 该 基本 块 的 传递 函数 
杀 死 了 对 这 个 变量 的 定 值 ， 同 时 它 还 加 入 (“ 生 成 ” ) 了 在 该 模块 中 发 生 的 对 变量 的 定 值 。 只 
要 一 个 定 值 到 达 某 个 点 的 任意 一 个 前 驱 , 它 就 到 达 了 该 点 , 因此 交汇 运算 是 并 集运 算 。 
CREE, 另 一 个 重要 的 数据 流 框架 计算 了 在 各 个 程序 点 上 活跃 的 (将 在 重新 定 值 之 前 被 
使 用 的 ) 变量。 这 个 框架 和 到 达 定 值 框架 类 似 , 但 是 传递 函数 是 逆向 传递 数据 流 值 的 。 一 
个 变量 在 某 个 基本 块 的 开始 处 活路 的 条 件 是 , 要么 在 该 基本 块 中 它 在 定 值 之 前 就 被 使 用 ， 
要 么 该 基本 块 中 没有 对 它 重新 定 值 且 它 在 该 基本 块 结尾 处 活跃 。 

可 用 表达 式 : 为 了 寻找 全 局 公共 子 表达 式 , 我 们 要 确定 各 个 程序 点 上 的 可 用 表达 式 。 所 
谓 可 用 表达 式 就 是 之 前 已 经 计算 过 , 且 在 最 后 一 次 计算 之 后 它 的 运算 分 量 都 没有 被 重新 
定 值 的 表达 式 。 这 个 问题 的 数据 流 框架 和 到 达 定 值 框架 类 似 , 但 是 其 交汇 运算 是 交集 运 
算 , 而 不 是 并 集运 算 。 

数据 流 问 题 的 抽象 : 常见 的 数据 流 问题 ， 比 如 前 面 提 到 过 的 那些 , 都 可 以 用 一 个 通用 的 数 
学 结构 表达 。 数 据 流 值 是 一 个 半 格 的 成 员 , 这 个 半 格 的 交汇 运算 就 是 数据 流 问 题 的 交汇 
(汇流 ) 函数。 传递 函数 把 半 格 元 素 映 射 到 半 格 元 素 。 要 求 传递 函数 的 集合 必须 对 于 组 合 
运算 封闭 , 并且 包含 单元 函数 。 

单调 框架 : 每 个 半 格 都 有 一 个 三 关系 a<b 当 且 仅 当 a A 人 45 = c。 单 调 框架 具有 以 下 性 质 ; 
每 个 传递 函数 都 保持 了 三 关系 。 也 就 是 说 ,对 于 任意 的 格 元 素 a Mb 以 及 传递 函数 了 
axb RET fla) <f(b). 

可 分 配 框架 : 这 种 框架 满足 下 面 的 条 件 : 对 于 所 有 的 格 元 素 a Ab BBS, fal 
b) =fla) AK8)。 可 以 证 明 可 分 配 框架 的 条 件 蕴含 了 单调 框架 的 条 件 。 = 
抽象 框架 的 选 代 解 法 : 所 有 的 单调 数据 流 框架 可 以 通过 一 个 迭代 算法 来 解决 。 在 这 个 解 
法 中 , 首先 (按照 不 同 的 框架 ) 适 当地 初始 化 各 个 基本 块 的 IN 和 0UT 值 , 然后 应 用 传递 
函数 和 交汇 运算 不 断 地 计算 这 些 变量 的 新 值 。 这 个 解法 总 是 安全 的 ( 即 按照 它 的 解 对 程 
序 进 行 优化 不 会 改变 程序 所 做 的 计算 ) 。 但 是 只 有 当 框架 是 可 分 配 的 时 , 这 个 解 才 一 定 是 
可 能 的 解 中 最 好 的 。 z 
常量 传播 框架 ; 昌 然 诸如 到 达 定 值 这 类 的 基本 框架 都 是 可 分 配 的 , 但 存在 一 些 单调 但 不 
可 分 配 的 框架 。 这 类 框架 中 的 一 个 例子 是 关于 常量 传播 的 。 在 常量 传播 框架 使 用 的 半 格 
中 , 格 元 素 是 从 程序 变量 到 常量 以 及 两 个 特殊 值 的 映射 。 这 两 个 特殊 值 分 别 代表 “无 信 
息 "” 和 "一定 不 是 常量 "。 

部 分 宛 余 消除 ; 很 多 有 用 的 优化 ,比如 代码 移动 和 全 局 公共 子 表达 式 消除 , 可 以 被 扩展 为 同 
一 个 问题 。 该 问题 称 为 部 分 宛 余 消除 。 如 果 在 某 个 点 上 需要 计算 一 个 表达 式 ,但 是 这 个 帮 


































机 器 无 关 优 化 








e 


达 式 只 在 到 达 这 个 点 的 部 分 路 答 上 可 用 ,那么 我 们 可 以 只 在 该 表达 式 不 可 用 的 路 径 
计算 。 正 确 地 应 用 这 个 想法 可 求解 决 四 个 不 同 的 数据 流 间 题 ,并 做 一 些 其 他 的 操作 。 
支配 结 点 : 如 果 在 一 个 流 图 中 所 有 到 达 某 结 点 的 路 径 都 必须 经 过 另 一 个 结 点 ,那么 后 
个 结 点 就 支配 前 一 个 结 点 。 一 个 真 支配 结 点 是 不 同 于 被 支配 结 点 的 支配 结 点 。 除 了 入 昌 
结 点 ,每 个 结 点 都 有 一 个 直接 支配 结 点 一 被 该 结 点 的 所 有 其 他 真 支配 结 点 所 支配 的 丰 
支配 结 点 。 

流 图 的 深度 优先 排序 : 如 果 我 们 从 一 个 流 图 的 入 口 结 点 开始 对 它 进行 深度 优先 搜索 ， 我 
们 会 得 到 一 个 深度 优先 生成 树 。 结 点 的 深度 优先 排序 是 这 标 树 的 后 序 遍历 次 序 的 逆序 。 
边 的 分 类 ; 当 我 们 构造 一 个 深度 优先 生成 树 之 后 , 相应 流 图 的 全 部 边 可 以 分 成 三 大 类 ; 前 
进 边 ( 即 从 祖先 结 点 到 真 后 代 结 点 的 边 ) 、 后 退 边 ( 即 从 后 代 结 点 到 祖先 结 点 的 边 ) 和 交叉 
边 (其 他 ) 。 生 成 树 的 一 个 重要 性 质 是 所 有 的 交叉 边 都 是 从 树 的 右边 到 达 左 边 。 另 一 个 重 
要 性 质 是 在 这 些 边 中 ,如果 按照 深度 优先 排序 ( 即 后 序 次 序 的 逆序 ) ,只 有 后 退 边 的 头 比 
它 的 尾 的 排序 更 靠 前 。 

回 边 : 回 边 就 是 其 头 结 点 支配 尾 结 点 的 边 。 不 管 选 择 流 图 的 哪 一 棵 深度 优先 生成 树 ,每 
条 回 边 都 是 一 条 后 退 边 。 l 

可 归 约 流 图 : 如 果 不 管 选 择 哪 个 深度 优先 生成 树 ,该 树 的 每 个 后 退 边 都 是 一 条 回 边 , 那么 


-进行 





这 个 流 图 就 是 可 归 约 的 。 绝 大 部 分 流 败 都 是 可 归 约 的 , 控制 流 语 名 都 是 通常 的 循环 和 分 
支 语句 的 程序 的 流 图 一 定 是 可 归 约 的 。 

自然 循环 : 一 个 自然 循环 是 一 个 结 点 的 集合 。 集 合 中 有 一 个 头 结 点 , 它 支 配 了 该 集合 中 
的 所 有 其 他 结 点 , 并 且 至 少 有 一 条 回 边 进入 这 个 涉 结 点 。 给 定 任意 的 回 边 , 我 们 可 以 构 








造 出 它 的 自然 循环 。 循 环 中 包括 问 边 的 头 结 点 ， 以 及 所 有 不 经 过 头 结 点 就 能 够 到 达 此 回 
边 的 尾 结 点 的 其 他 结 点 。 两 个 具有 不 同 头 结 点 的 自然 循环 要 么 互 不 相交 , 要么 一 个 循环 
完全 包含 在 另 -个 循环 里 面 。 这 个 性 质 使 得 我 们 可 以 讨论 嵌 套 循环 的 层次 结构 ,前 提 是 
“循环 ” 指 的 是 自然 循环 。 

深度 优先 排序 提高 了 选 代 算法 的 效率 : 如 果 沿 着 无 环 路 径 传播 信息 足以 得 到 正确 结果 ， 
即 环 路 不 会 增加 信息 , 那么 相应 的 迭代 算法 只 需要 很 少 几 次 迁 代 就 可 以 得 到 正确 结果 。 
如 果 我 们 按照 深度 优先 顺序 访问 结 点 , 那么 任何 向 前 传递 信息 的 数据 流 框架 ( 比如 到 达 定 
值 ) 都 可 以 在 确定 次 数 内 收 但 。 收 敛 次 数 不 大 于 所 有 无 环 路 径 中 的 后 退 边 的 最 大 个 数 加 
上 2。 如 果 我 们 用 深度 优先 顺序 的 逆序 ( 即 后 序 次 序 ) 访 问 结 点 ， 上 面 的 结论 对 于 逆向 传 
播 的 框架 ( 比如 活跃 变量 ) 也 成 立 。 

KX: 区 域 是 一 个 结 点 和 边 的 集合 。 区 域 中 有 一 个 头 结 点 支配 了 其 中 的 所 有 结 点 。 除 
也 之 外 ,区域 中 所 有 结 点 的 前 驱 必须 也 在 此 区 域 中 。 区 域 的 边 集 包含 了 区 域 中 的 任意 
两 个 结 点 之 间 的 边 , 但 是 可 能 不 包含 某 些 或 所 有 到 达 头 结 点 的 边 。 
区 域 和 可 归 约 流 图 : 可 归 约 流 图 可 以 被 扫描 分 析 成 为 一 个 由 区 域 组 成 的 层次 结构 。 这 些 
区 域 要 么 是 循环 区 域 , 要 么 是 循环 体 区 域 。 循 环 区域 包 含 了 所 有 进入 头 结 点 的 边 , TOR 
环 体 区 域 不 包含 到 达 头 结 点 的 边 。 

基于 区 域 的 数据 流 分 析 : 不 同 于 和 迭代 方法 的 另 一 种 数据 流 分 析 方 法 是 沿 着 区 域 层次 结构 
向 上 然后 再 向 下 扫描 , 计算 从 各 个 区 域 的 头 到 达 该 区 域 中 各 个 结 点 的 传递 函数 。 

基于 区 域 的 归纳 变量 检测 : 基于 区 域 的 分 析 技 术 的 重要 应 用 之 一 是 用 以 寻找 归纳 变量 的 
数据 流 框架 。 该 框架 试图 找 出 循环 区 域 中 每 个 满足 下 面条 件 的 变量 的 公式 。 这 些 变量 的 
值 可 表示 为 循环 迭代 次 数 的 仿 射 (线性 ) 函数 。 
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第 10 章 ”指令 级 并 行 性 


每 一 个 现代 高 性 能 处 理 器 都 能 够 在 一 个 时 钟 周期 内 执行 多 条 指令 。 在 一 个 具有 指令 级 并 行 
机 制 的 处 理 器 上 一 个 程序 能 够 以 多 快 的 速度 运行 ? 这 可 是 一 个 “价值 十 亿美 元 的 问题 "。 对 这 个 
问题 的 问答 要 考虑 下 列 因 素 : 

1) 该 程序 中 潜在 的 并 行 性 。 

2) 该 处 理 器 上 可 用 的 并 行 性 。 

3) 从 原来 的 顺序 程序 中 抽取 并 行 性 的 能 力 。 

4) 在 给 定 的 指令 调度 约束 之 下 找到 最 好 的 并 行 调度 方案 的 能 

如 果 一 个 程序 中 的 所 有 运算 之 间 都 是 高 度 依赖 的 , 那么 再 多 的 硬件 或 采用 并 行 化 技术 都 无 
法 使 这 个 程序 快速 并 行 执行 。 关 于 并 行 化 的 限制 方面 已 经 有 了 很 多 研究 。 典 型 的 非 数 值 应 用 有 
很 多 固有 的 依赖 性 。 比 如 , 这些 程序 具有 很 多 依赖 于 数据 的 分 支 , 使 得 哪怕 预测 一 下 下 面 将 执行 
哪 条 指令 都 变 得 很 困难 , 更 不 要 说 去 决定 哪些 运算 可 以 并 行 执行 了 。 因 此 , 这 个 领域 中 的 研究 工 
作 和 集中 在 放松 调度 约束 的 技术 , 包括 引入 新 的 体系 结构 特性 , 而 不 是 调度 技术 本 身 。 

数值 应 用 ( 比如 科学 计算 和 信号 处 理 ) 往 往 具 有 更 好 的 并 行 性 。 这 些 应 用 处 理 大 型 的 聚合 数 
据 结构 。 在 该 结构 的 不 同 元 素 上 的 运算 通常 是 相互 独立 的 , 可 以 并 行 地 执行 。 在 高 性 能 通用 机 器 
和 数字 信号 处 理 器 中 都 提供 了 附加 的 硬件 资源 来 利用 这 些 并 行 性 。 这 些 程序 通常 具有 简单 的 控 
制 结构 和 规则 的 数据 访问 模式 。 已 经 有 一 些 静态 技术 可 以 用 来 从 这 些 程序 中 抽取 出 可 用 的 并 行 
性 。 这 类 应 用 的 代码 调度 很 有 意思 也 很 重要 ， 因 为 它们 允许 大 量 的 独立 运算 被 映射 到 大 量 的 资 
源 上 运行 。 

并 行 性 抽取 和 并 行 执行 的 调度 可 以 通过 软件 静态 完成 , 也 可 以 通过 硬件 动态 进行 。 实 际 上 ， 
即使 是 具有 硬件 调度 机 制 的 机 器 也 可 以 辅 以 软件 调度 。 本 章 将 首先 解释 使 用 指令 级 并 行 性 的 一 
些 基 本 问题 。 不 管 是 硬件 管理 的 并 行 性 还 是 软件 管理 的 并 行 性 ,这 些 问题 都 是 一 样 的 。 然 后 我 
们 给 出 并 行 性 抽取 所 需 的 基本 数据 依赖 性 分 析 。 这 些 分 析 也 可 用 于 指令 级 并 行 性 之 外 的 其 他 优 
化 。 我 们 将 在 第 11 章 中 看 到 这 些 分 析 技 术 的 其 他 应 用 。 

最 后 , 我们 给 出 代码 调度 中 的 基本 思想 。 我 们 将 描述 一 个 用 于 基本 块 调度 的 技术 , 并 给 出 一 
个 方法 来 处 理 通 用 程序 中 高 度数 据 依赖 的 控制 流 , 最 后 给 出 一 个 称 为 “软件 流水 线 化 ”的 技术 。 
软件 流水 线 化 技术 主要 用 于 数值 计算 程序 的 调度 。 

10.1 处 理 器 体系 结构 

当 我 们 考虑 指令 级 并 行 性 的 时 候 , 通常 设想 的 是 一 个 在 每 个 时 钟 周 期 内 发 出 多 条 运算 指令 
的 处 理 器 。 实 际 上 ，, 如果 使 用 流水 线 (pipelining) 的 概念 , 即使 一 个 机 器 每 个 时 钟 周期 弓 发 送 一 条 
运算 指令 , 我 们 仍然 能 够 得 到 指令 级 并 行 性 。 下 面 , 我 们 将 首先 解释 流水 线 的 概念 ,然后 再 讨论 
多 指令 发 送 。 











O 在 含义 明确 的 时 候 ,我 们 将 把 时 钟 * 咬 噶 " 或 者 时 钟 周期 简称 为 “时 钟 ”。 
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10.1.1 指令 流水 线 和 分 支 延 时 

在 实践 中 , 不 管 是 高 性 能 超级 计算 机 还 是 普通 的 机 器 ， a 
struction pipeline) 。 使 用 指令 流水 线 ,， 每 个 时 钟 周期 都 可 以 取得 一 个 新 指令 , 而 此 时 前 面 的 指令 还 
在 流水 线 中 执行 。 图 10-1 显示 的 是 一 个 简单 的 5 
阶段 指令 流水 线 : 它 首先 获取 指令 (IF) , 对 该 指令 ee age. ee en Sere 





解码 (ID), 执行 运算 (EX) ,访问 内 存 (MEM), 然 | 1 oP 

后 回 写 结果 ( WB) 。 该 图 显示 了 指令 itlvit2、 | > DO Eo 

i+3 和 i+4 是 如 何在 同一 时 刻 并 行 运行 的 。 图 中 | 4 MEM RX I J 

的 每 一 行 对 应 于 一 个 时 钟 周期 , 而 每 - 列 指明 了 各 | 5 NBO MEM EX ID IP 

.条 指令 在 各 时 钟 周期 中 所 在 的 阶段 。 7 WB MPM BX 
如 果 在 后 续 指令 需要 某 条 指令 的 结果 时 此 结果 | 8 ae 











已 经 可 用 , 那么 处 理 器 就 可 以 在 每 个 时 钟 周期 内 发 
出 一 条 指令 。 分 支 指令 特别 容易 出 现 问题 ， 因 为 只 图 10-1 在 一 个 5 阶段 指令 流水 线 中 的 

有 在 它们 被 获取 、 解 码 并 执行 之 后 ,处 理 器 才能 够 五 个 连续 指令 

Ai FTO RS REA AMARA SARE 投机 性 地 选取 下 一 条 指令 并 解码 。 
但 是 当 这 个 分 支 真 的 需要 跳 转 的 时 候 , 指令 流水 线 被 清空 o 跳 转 的 目标 指令 。 因 此 , 分 
支 跳 转 引入 了 为 获取 分 支 跳 转 目标 而 引起 的 延 时 ,并 使 得 指令 流水 线 “ 打 踪 "。 先 进 的 处 理 器 使 
用 硬件 根据 分 支 运行 的 历史 来 预测 它们 的 结果 ,并 从 预测 的 目标 位 置 预 取 指令 。 但 是 如 果 分 支 
预测 错误 , 依然 会 出 现 分 支 延 时 。 

10.1.2 ”流水线 执 行 

有 些 指 令 的 执行 需要 几 个 时 钟 周期 。 一 个 常见 的 例子 是 内 存 加 载运 算 。 即使 某 次 内 存 访 问 
的 目标 数据 已 经 在 高 速 缓存 中 , 高 速 缓存 仍然 需要 多 个 时 钟 周期 才 会 返回 数据 。 如 果 一 条 指令 
的 后 继 指令 在 不 需要 该 指令 的 运算 结果 时 可 以 立刻 往 下 执行 , 我 们 就 说 该 指令 的 执行 被 流水 线 
化 (pipelined) 了。 因此 ,即使 一 个 处 理 器 在 每 个 时 钟 周期 内 只 能 发 送 一 条 指令 , 但 仍然 可 能 在 同 
一 时 刻 有 多 条 指令 在 它们 各 自 的 阶段 上 执行 。 如 果 最 深 的 执行 流水 线 有 nn 个 阶段 , 那么 在 同一 
时 刻 最 多 可 允许 n 条 指令 处 于 执行 状态 。 请 注意 ,不 是 所 有 的 指令 都 是 完全 流水 线 化 的 。 虽 然 浮 
点 数 加 法 和 乘法 通常 都 被 完全 地 流水 线 化 了 , 但 更 加 复杂 且 很 少 执行 的 浮 点 数 除法 却 没 有 做 到 
这 一 点 。 

大 多 数 通 用 处 理 器 动态 地 检测 连续 指令 之 间 的 依赖 关系 , 并 在 指令 的 运算 分 量 尚 不 可 用 时 
自动 阻塞 这 些 指 令 的 执行 。 有 些 处 理 器 , 特别 是 手持 设备 中 的 岩 和 人 式 芯 片 ， 则 把 依赖 关系 检查 工 
作 留 给 软件 来 做 ,以 便 简化 硬件 并 降低 能 耗 。 在 这 种 情况 下 ， 相应 的 编译 器 负责 在 必要 时 向 代码 
中 插入 “no-op” 指 令 ( 即 不 做 任何 处 理 的 指令 ,以 保证 需要 某 条 指令 的 计算 结果 时 该 
结果 一 定 可 用 。 

10.1.3 多 指令 发 送 

通过 在 每 个 时 钟 周期 发 送 多 条 指令 ,处 理 器 可 以 在 同一 时 刻 运行 更 多 指令 。 可 同时 执行 的 
指令 数目 是 指令 发 送 宽度 和 指令 执行 流水 线 中 平均 阶段 数目 的 乘积 。 

和 流水 线 处 理 类 似 ,多 发 送 机 器 的 并 行 性 既 可 以 通过 硬件 管理 , 也 可 以 通过 软件 管理 。 依 靠 软 
件 管理 其 并 发 性 的 机 器 称 为 YLIW( 非常 长 指令 字 ，Very-Long-Instruction-Word) 机 器 ,而 那些 使 用 硬 
件 管理 其 并 发 性 的 机 器 称 为 超标 量 (superscalar) 机器。 顾名思义 , VLIW 机 器 的 指令 字 宽 度 比 一 般 指 

令 字 更 长 。 每 条 这 样 的 指令 字 是 要 在 同一 时 钟 周期 内 发 送 的 多 条 指令 的 编码 。 编 译 器 决定 哪些 运 
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算 将 被 并 行 地 发 送 , 并 把 这 些 信息 在 机 器 代码 中 明确 地 编码 。 男 一 方面 , 超标 量 机 器 有 一 个 普通 的 
指令 集 , 并 且 具 有 普通 的 顺序 执行 语义 。 超 标量 机 咒 自 动 检测 指令 之 间 的 依赖 关系 , 并 在 这 些 指令 
的 运算 分 量变 得 可 用 时 发 送 它们 。 有 些 处 理 器 同时 包含 VLIW 和 超标 量 两 种 功能 。 

简单 的 硬件 指令 调度 融 按 照 指令 获取 的 顺序 执行 指令 。 如 果 指 令 调 度 器 磁 到 一 个 依赖 前 面 
指令 的 指令 , 那么 该 指令 及 其 全 部 后 继 指 令 必 须 等 待 依赖 关系 的 解除 ( 即 等 待 它 所 需 的 其 他 指令 
的 计算 结果 变 得 可 用 )。 如 果 有 一 个 静态 指令 调度 器 能 够 把 相互 独立 的 运算 按 执行 顺序 放 在 一 
起 ,那么 这 样 的 机 器 显然 能 够 从 这 个 静态 指令 调度 器 获 益 。 

更 加 复杂 的 指令 调度 器 可 以 " 颠 三 倒 四 "地 执行 指令 。 指 令 可 以 被 单独 地 阻塞 ， 直 到 被 阻塞 
指令 所 需 的 所 有 值 都 已 经 生成 后 再 继续 执行 。 即 使 是 这 些 指令 调度 器 也 可 以 从 静态 调度 获 益 ， 
因为 硬件 指令 调度 器 只 有 有 限 的 空间 来 缓冲 那些 必须 被 阻塞 的 指令 。 静 态 调度 可 以 把 相互 独立 
的 指令 放 得 比较 靠近 ,以 便 更 好 地 利用 硬件 设施 。 更 重要 的 是 , 不 管 动态 指令 调度 器 有 多 复杂 ， 
它 都 不 能 执行 它 还 没有 获取 的 指令 。 当 处 理 器 不 得 不 执行 一 个 未 预见 的 分 支 时 , 它 只 能 在 新 近 
获取 的 指令 中 寻找 并 行 性 。 编 译 器 可 以 设法 保证 这 些 新 获取 的 指令 可 以 并 行 执行 ,以 此 来 增强 
动态 指令 调度 器 的 性 能 。 


10.2 代码 调度 约束 


代码 调度 是 程序 优化 的 一 种 形式 ， 它 应 用 于 由 代码 生成 器 生成 的 机 器 代码 。 代 码 调度 要 遵 
守 下 面 三 种 约束 : 

1) 控制 依赖 约束 。 所 有 在 原 程序 中 执行 的 运算 都 必须 在 优化 后 的 程序 中 执行 。 

2) 数据 依赖 约束 。 优 化 后 的 程序 中 的 运算 必须 和 原 程序 中 的 相应 运算 生成 相同 的 结果 。 

3) 资源 约束 。 调 度 不 能 够 超额 使 用 机 器 上 的 资源 。 

这 些 调 度 约束 保证 了 优化 后 的 程序 和 原 程序 生成 同样 的 结果 。 但 是 , 因为 代码 调度 改变 了 
运算 执行 的 顺序 , 所 以 优化 后 的 程序 执行 时 某 一 点 上 的 内 存 状 态 可 能 和 顺序 执行 时 任 一 点 上 的 
内 存 状 态 都 不 匹配 。 如 果 一 个 程序 的 执行 因 异 常 或 用 户 设 定 的 断 点 而 中 断 时 ,就 会 产生 问题 。 
因此 经 过 优化 的 程序 比较 难以 调试 。 请 注意 ,这 个 问题 不 是 代码 调度 专 有 的 , 所 有 的 优化 技术 都 
会 出 现 这 个 问题 , 包括 部 分 宛 余 消除 ( 见 9.5 节 ) 和 寄存 器 分 配 ( 见 8.8 节 )。 

10.2.1 数据 依赖 

BR, 如 果 两 个 运算 不 接触 同一 个 变量 , 那么 改变 这 两 个 运算 的 执行 顺序 肯定 不 会 影响 它们 
的 执行 结果 。 实 际 上 , 即使 这 两 个 运算 读 取 同 一 个 变量 的 值 , 我 们 仍然 可 以 交换 它们 的 执行 次 
序 。 只 有 当 一 个 运算 向 一 个 变量 写 值 ， 而 另 一 个 运算 对 这 个 变量 执行 读 或 写 运算 时 , 改变 它们 的 
执行 次 序 才 会 改变 它们 的 结果 。 这 样 的 一 对 操作 之 间 被 认为 存在 数据 依赖 (data dependence) X 
A, 并 且 它 们 的 相对 执行 顺序 必须 保持 不 变 。 有 三 种 类 型 的 数据 依赖 关系 : 

1) 真 依赖 : 写 之 后 再 读 。 如 果 一 个 写 运算 后 面 跟随 一 个 对 同一 个 位 置 的 读 运 算 , 那么 这 个 
读 操 作 就 依赖 于 被 写 人 的 值 , 这 种 依赖 关系 被 认为 是 一 个 真 依赖 关系 。 

2) 反 依赖 : 读 之 后 再 写 。 如 果 一 个 读 运算 之 后 跟随 一 个 对 同一 个 位 置 的 写 运算 , 我 们 说 存 
在 一 个 从 读 运 算 到 写 运 算 的 反 依 赖 关 系 。 写 运算 本 质 上 不 依赖 于 读 运 算 , 但 是 如 果 写 运算 在 读 
运算 之 前 发 生 , 那么 这 个 读 运 算 将 读 取 到 错误 的 值 。 反 依赖 关系 是 强制 式 编程 的 一 个 副产品 。 
这 种 语言 中 同一 个 内 存 位 置 可 以 在 不 同时 刻 存放 不 同 的 值 。 这 不 是 一 个 “ 真 ” 依 赖 关系 ,可 以 把 
值 存放 在 不 同 的 位 置 上 以 达到 消除 反 依赖 关系 的 目的 。 : 

3) 输出 依赖 ; 写 之 后 再 写 。 对 同一 个 位 置 的 两 个 写 运算 之 间 有 输出 依赖 关系 。 如 果 违 反 了 
这 个 关系 , 那么 在 这 两 个 运算 都 完成 之 后 , 被 写 内存 位 置 上 存放 的 是 错误 的 值 。 
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反 依赖 关系 和 输出 依赖 关系 被 称 为 存储 相关 的 依赖 (storage-related dependence) 。 这 些 都 不 
是 " 真 " 的 依赖 关系 ,可 以 通过 使 用 不 阅 的 内 存 位 置 存 放 不 同 的 值 来 消除 这 些 依赖 关系 。 请 注意 ， 
数据 依赖 关系 对 于 内 存 访问 和 寄存 器 访问 同样 有 效 。 

10. 2.2 和 寻找 内 存 访问 之 间 的 依赖 关系 

要 检查 两 个 内 存 访问 之 间 是 否 有 数据 依赖 关系 , 我 们 只 需要 指出 它们 是 否 可 能 指向 同一 个 
内 存 位 置 , 而 不 需要 知道 到 底 访 问 哪 个 位 置 。 比 如 , 虽然 我 们 可 能 不 知道 指针 p 到 底 指 向 哪里 ， 
但 仍然 可 以 指出 两 个 访问 *p 和 *(p +4) (原文 为 (*p) + 4 一 一 译 者 注 ) 不 可 能 指向 同一 个 位 
置 。 总 的 来 说 , 数据 依赖 关系 是 不 可 能 在 编译 时 刻 完全 确定 的 。 除 非 能 够 证 明 两 个 运算 指向 不 
同 的 位 置 , 否则 编译 器 必须 假设 它们 可 能 会 指向 同一 个 位 置 。 

i 10. 给 定 下 面 的 代码 序列 





1) a = 1 

2) *p = 2 

3) x = a : 

除非 编译 器 知道 P 不 可 能 指向 a, 否则 它 必 须 决 定 这 三 个 运算 需要 顺序 执行 。 从 请 名 (1 ) 到 
语句 (2) 有 一 个 输出 依赖 关系 ,从 语句 (1) (2) 到 语句 (3) 有 两 个 真 依赖 关系 。. 口 


数据 依赖 分 析 对 于 程序 所 使 用 的 程序 设计 语言 是 很 敏感 的 。 对 于 非 类 型 安全 的 语言 , 比如 C 
和 C ++， 一 个 指针 可 以 被 强制 转换 , 指向 任何 类 型 的 数据 对 象 ， 因此 要 证 明 任 意 一 对 基于 指针 
的 内 存 访问 之 间 的 独立 性 需要 复杂 的 分 析 过 程 。 即 使 对 于 局 部 变量 和 全 局 标量 变量 , 除非 可 以 
证 明 它 们 的 地 址 没有 被 程序 中 的 指令 存放 到 任何 地 方 , 它们 也 有 可 能 通过 指针 被 间接 访问 。 在 
像 Java 这 样 的 类 型 安全 的 语言 中 , 不 同类 型 的 对 象 一 定 是 相互 独立 的 。 类 似 地 , 栈 中 的 局 部 简单 
变量 不 可 能 通过 其 他 的 变量 名 字 进 行 访问 。 

发 现 正确 的 数据 依赖 关系 需要 多 种 不 同类 型 的 分 析 。 我 们 将 关注 那些 主要 的 问题 。 如 果 编 
译 器 想 要 检测 一 个 程序 中 的 所 有 数据 依赖 关系 , 它 必须 首先 解决 这 些 问题 , 并 说 明 如 何 使 用 这 些 
信息 进行 代码 调度 。 后 面 的 章节 将 说 明 这 些 分 析 是 如 何 完成 的 。 

数组 的 数据 依赖 分 析 

数组 的 数据 依赖 分 析 问 题 主要 是 区 分 数组 元 素 访问 中 的 下 标 值 。 比 如 , 下 面 的 循环 


for (i = 0; i < n; i++) 
: A[2*i] = A[2*i+1]; 


把 数组 4 的 奇数 号 元 素 拷贝 到 紧 靠 在 该 元 素 之 前 的 偶数 号 元 素 中 去 。 因 为 这 个 循环 中 所 有 的 读 / 
写 运算 的 位 置 互 不 相同 , 这 些 访 问 之 闻 没 有 任何 依赖 关系 ,所 以 循环 中 所 有 的 迭代 都 可 以 并 行 执 
行 。 数 组 的 数据 依赖 分 析 , 简称 为 数据 依赖 分 析 ( data-dependence analysis) , 对 于 数值 应 用 的 优化 
来 说 是 非常 重要 的 。 这 个 主题 将 在 11.6 节 中 详细 讨论 。 

指针 别名 分 析 

如 果 两 个 指针 指向 同一 个 对 象 , 我 们 就 说 它们 互 为 别名 (aliased)。 指 针 别 名 的 分 析 很 困难 ， 
原因 是 一 个 程序 中 具有 很 多 可 能 互 为 别名 的 指针 。 随 着 时 间 的 发 展 , 它们 中 的 每 个 都 可 能 指向 
无 限 多 个 动态 对 象 。 为 了 得 到 精确 的 信息 ,进行 指针 别名 分 析 时 必须 跨越 程序 中 的 各 个 消 数 。 
这 个 主题 从 12.4 节 开 始 讨论 。 

过 程 间 分 析 

对 于 通过 引用 传递 参数 的 语言 ,需要 使 用 过 程 间 分 析 来 确定 是 否 同一 个 变量 被 当 作 两 个 或 
多 个 不 同 的 参数 进行 传递 。 这 类 别名 看 起 来 可 能 会 在 不 同 的 参数 之 间 建 立 依赖 关系 。 类 似 地 ， 
全 局 变量 可 能 被 用 作 参 数 , 由 此 会 建立 参数 访问 和 全 局 变量 访问 之 间 的 依赖 。 在 确定 这 些 别 名 
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时 ,第 12 章 中 讨论 的 过 程 间 分 析 技 术 是 必需 的 。 
10.2.3 ”寄存 器 使 用 和 并 行 性 之 间 的 折衷 

在 这 一 章 中 ,我 们 将 假设 源 程序 的 机 器 无 关中 间 表 示 形 式 使 用 了 无 限 多 个 伪 寄 存 器 (pseud- 
oregister) 。 这 些 伪 寄存 器 代表 了 可 以 分 配 到 寄存 器 的 变量 。 这 些 变量 包括 源 程序 中 不 能 通过 任 
何其 他 名 字 访 问 的 标量 ,也 包括 由 编译 器 生成 的 用 于 存放 表达 式 的 部 分 结果 的 临时 变量 。 和 内 
存 位 置 不 同 , 寄存 器 的 命名 是 唯一 的 。 因 此 可 以 很 容易 地 为 寄存 器 访问 生成 精确 的 数据 依赖 
约束 。 

在 中 间 表 示 形 式 中 使 用 的 无 限 多 个 伪 寄 存 器 最 终 必 须 被 映射 到 在 目标 机 器 上 可 用 的 少量 物 
理 寄 存 器 。 把 几 个 伪 寡 存 器 映射 为 同一 个 物理 寄存 器 有 一 个 副作用 。 这 种 映射 会 生成 人 为 的 存 
储 依赖 ,这 限制 了 指令 级 的 并 行 性 。 反 过 来 ， 并行 执行 指令 产生 了 更 多 的 存储 需求 , 以 便 存 放 同 
时 计算 出 来 的 值 。 因 此 , 尽量 降低 寄存 器 使 用 数量 的 目标 和 最 大 化 指令 级 并 行 性 的 目标 直接 冲 
突 。 下 面 的 例 10.2 和 例 10.3 说 明了 存储 和 并 行 性 之 间 的 内 型 折衷 处 理 。 








硬件 寄存 器 重 命名 

省 令 级 并 行 性 首先 是 作为 一 种 加 快 普通 的 顺序 机 器 代码 执行 速度 的 手段 在 计算 机 体系 结 
构 中 使 用 的 。 当 时 的 编译 器 还 不 知道 机 器 上 的 指令 级 并 行 性 , 其 目标 是 优化 寄存 器 的 使 用 。 
它们 仔细 地 重新 排列 指令 以 使 所 用 的 寄存 器 数目 最 少 , 但 同时 也 使 可 用 的 并 行 性 的 数量 减 到 
最 少 。 例 10. 3 说 明 的 是 在 表达 式 树 的 计算 过 程 中 最 小 化 寄存 器 使 用 的 同时 也 限制 了 它 的 并 
行 性 。 

在 顺序 代码 中 的 并 行 性 太 少 了 ,计算 机 体系 结构 设计 师 不 得 不 发 明了 硬件 寄存 器 重 命名 
(hardware register renaming) 的 概念 ,试图 通过 寄存 器 重 命名 来 撤销 寄存 器 优化 所 带 来 的 影响 。 
硬件 寄存 器 重 命名 在 程序 运行 时 动态 地 改变 寄存 器 的 指派 。 它 对 机 器 代码 进行 解释 ,把 本 来 
存放 在 同一 个 寄存 器 中 的 值 存放 在 不 同 的 内 部 寄存 器 中 ,并 把 对 这 些 值 的 使 用 修正 到 相应 的 
内 部 寄存 器 。 

因为 人 为 的 寄存 器 依赖 约束 首先 是 由 编译 器 引入 的 ,如 果 使 用 了 一 个 认识 到 指令 级 并 行 
性 的 寄存 器 分 配 算法 ,这 些 约束 就 可 以 被 消除 。 当 一 个 机 器 的 指令 集 只 能 引用 少量 寄存 器 时 ， 
硬件 寄存 器 重 命名 机 制 仍然 是 有 用 的 。 这 种 能 力 使 得 我 们 可 以 给 出 这 个 指令 集体 系 结构 的 更 
好 的 实现 ,把 代码 中 的 由 指令 集体 系 结构 规定 的 少量 寄存 器 动态 地 映射 到 多 得 多 的 内 部 寄存 
器 上 。 

















UA 下 面 的 代码 使 用 伪 寄 存 器 ti 和 t2 把 位 于 位 置 a 和 c 上 的 变量 的 值 分 别 复制 到 在 位 
置 b 和 ad 上 的 变量 中 。 | 


LD ti,a //ti=a 
ST b, ti //b = tl 
LD t2, c //t2=c 
ST d, t2 // a = t2 i 


如 果 已 知 所 有 被 访问 的 内 存 位 置 都 互 不 相同 , 那么 上 面 的 复制 过 程 可 以 并 行进 行 。 但 是 ， 如果 为 
了 尽量 降低 所 用 寄存 器 的 数量 而 把 ti 和 t2 赋 给 同一 个 寄存 器 , 那么 复制 过 程 就 只 能 顺序 进 
行 了 。 > 
DME 传统 的 寄存 器 分 配 技术 的 目标 是 尽 可 能 减少 一 个 计算 过 程 所 需要 的 寄存 器 数目 。 考 
ERAR | 


(a+b)+c+ (d t+ e) 
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的 计算 。 
但 是 , 对 寄存 器 的 复 用 使 得 计算 串 行 化 。 叭 一 可 以 并 行 执行 的 运算 是 把 位 置 a 和 ob 的 值 加 
载 到 寄存 器 ,以 及 把 位 置 a 和 e 的 值 加 载 到 寄存 器 。 因 此 并 行 地 完成 这 个 计算 共 需 要 7 步 。 














LD ri, a /7 Tri =à 
LD r2, b // r2 =b 
px ADD r1, ri, r2 // ri = ri+r2 
L T LD r2, c A TEE 
+ + ADD ri, r1, r2 // ri = ritr2 
Let Na LD r2, d // r2=4 
下 é d z LD r3, e // r3 =e 
sess ADD r2, r2, r3 // r2 = r2+r3 
vs ADD r1, ri, r2 // ri = ritr2 
图 10-2 fA) 10.3 中 的 表达 式 树 图 10-3 ”图 10-2 中 表达 式 的 机 器 代码 
假如 我 们 使 用 不 同 的 寄存 器 来 存放 各 个 部 分 和 , 这 个 表达 式 可 以 在 4 步 内 完成 求 值 。 这 个 步 
数 正好 是 图 10-2 中 的 表达 式 树 的 高 度 。 网 10-4 给 出 了 这 样 的 并 行 计算 过 程 。 口 





z3 =c] r4 = dlr5 ze 
| | 


|| 
图 10-4 图 10-2 中 表达 式 的 并 行 求 值 过 程 


10.2.4 寄存 器 分 配 阶 段 和 代码 调度 阶段 之 间 的 顺序 

如 果 在 代码 调度 之 前 进行 寄存 器 分 配 , 那么 得 到 的 代码 往往 会 有 很 多 存储 依赖 ,而 这 会 眼 制 
代码 调度 。 男 一 方面 ， 如 果 在 寄存 器 分 配 之 前 先进 行 代码 调度 , 那么 得 到 的 代码 调度 方案 可 能 需 
要 太 多 的 寄存 器 , 以 至 于 寄存 器 溢出 (spiling) 会 抵消 指令 级 并 行 性 所 带 来 的 好 处 。 所 谓 寄存 器 
溢出 是 指 把 一 个 寄存 器 中 的 内 容 保存 到 一 个 内 存 位 置 上 ,使 得 该 寄存 器 可 以 用 于 其 他 目的 。 一 





IT1 = 3 r2 = b 
r6 = ri+r2 | r7 = r4+r5 
r8 = r6+r3 


r9 = r8+r7 








个 编译 器 应 该 首先 分 配 寄 存 器 然后 再 进行 代码 调度 吗 ? 还 是 应 该 按照 相反 顺序 处 理 ? 或 者 我 们 
同时 解决 这 两 个 问题 ? 


为 了 回答 上 面 的 问题 , 我 们 必须 考虑 被 编译 程序 的 特性 。 很 多 非 数 值 应 用 没有 那么 多 可 用 
的 并 行 性 。 把 少量 的 寄存 器 专门 用 于 保存 表达 式 的 临时 结果 就 足够 了 。 我 们 可 以 首先 应 用 8. 8. 4 
节 中 所 述 的 着 色 算法 , 为 所 有 非 临 时 变量 分 配 寄存 器 , 然后 进行 代码 调度 , 最 后 为 临时 变量 分 配 
寄存 器 。 Baie 

这 个 方法 对 于 数值 应 用 的 效果 就 不 太 好 (数值 应 用 中 有 很 多 大 型 表达 式 ) 。 我 们 可 以 使 用 层 
次 化 的 方法 来 处 理 。 代 码 优化 首先 从 最 内 层 循环 开始 , 按照 从 内 向 外 的 顺序 进行 。 首 先进 行 指 
令 调 度 , 此 时 假设 可 以 给 每 个 伪 寄 存 器 分 配 一 个 独占 的 物理 寄存 器 。 然 后 进行 寄存 器 分 配 , 并 在 
需要 的 地 方 加 入 处 理 寄 存 器 溢出 的 代码 , 然后 再 次 对 代码 进行 调度 。 然 后 我 们 对 较 外 层 的 循环 
重复 这 个 过 程 。 当 把 同一 个 外 层 循 环 中 的 多 个 内 层 循环 一 起 考虑 时 , 同一 个 变量 可 能 在 不 同 内 
层 循 环 中 被 分 配 到 不 同 的 寄存 器 中 。 我 们 可 以 改变 寄存 器 的 分 配方 案 ,以 避免 把 值 从 一 个 寄存 
器 复制 到 另 一 个 寄存 器 。 在 10. 5 节 中 , 我 们 将 在 特定 调度 算法 的 上 下 文 环境 下 进一步 讨论 寄存 
器 分 配 和 指令 调度 之 间 的 关系 。 
10.2.5 控制 依赖 

对 一 个 基本 抉 内 的 运算 进行 调度 是 相对 容易 的 。 央 为 一 旦 控制 流 到 达 基 本 块 的 开头 ,所 有 
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的 指令 都 必然 会 执行 。 只 要 满足 所 有 的 数据 依赖 , 一 个 基本 块 内 的 指令 可 以 进行 任意 重新 排序 。 
HARKE, 基本 块 通常 都 很 小 , 对 非 数值 程序 而 言 尤 其 如 此 。 一 个 基本 块 平 均 只 有 大 约 五 条 指 
令 。 另 外 , 同一 个 基本 块 内 的 运算 经 常 是 紧密 相关 的 ， 因 此 很 少 有 并 行 性 。 可 见 ， 利用 基本 块 之 
间 的 并 发 性 是 至 关 重 要 的 。 

一 个 优化 后 的 程序 必须 执行 原 程序 中 的 所 有 运算 。 它 可 以 比 原 程 序 执行 更 多 的 指令 ,前提 
是 额外 增加 的 指令 没有 改变 程序 所 做 的 计算 。 为 什么 执行 额外 的 指令 能 够 加 快 一 个 程序 的 执行 
速度 ?如 果 我 们 知道 一 条 指令 可 能 会 执行 , 而 且 有 空闲 的 资源 来 “免费 ”执行 这 个 指令 , 我 们 就 
可 以 先 投机 性 地 (speculatively ) 执 行 这 条 指令 。 如 果 这 个 投机 是 正确 的 , 那么 程序 的 执行 速度 就 
会 变 快 。 

如 果 指 令 i, 的 结果 决定 了 指令 i 是 否 执行 , 那么 就 说 指令 i 是 控制 依赖 ( control-dependent ) 
于 指令 的。 控制 依赖 的 概念 和 块 结构 程序 中 的 机 套 层 次 相对 应 。 明 确 地 说 ,在 if-else 语句 

if (c) si; else s2; 
中 , sl 和 s2 是 控制 依赖 于 ec 的。 类 似 地 , 在 while 语句 

while (c) s; 
H, 循环 体 s 控制 依赖 于 co 
UDS 在 代码 片段 


if (a> t) 








b = a*a; 
d = a+c; 


中 , 语句 b =a*a 和 d=a+tc 和 此 片断 中 的 其 他 部 分 都 没有 数据 依赖 关系 。 语 句 b =a *a 依赖 
于 比较 表达 式 a >1。 但 是 , WA dsa +c 不 依赖 于 这 个 比较 表达 式 , 它 可 以 在 任何 时 刻 运行 。 
假设 乘法 运算 a * a 不 会 引起 任何 副作用 , 那么 它 就 可 以 被 投机 地 执行 , 前 提 是 只 有 在 发 现 a 大 
于 :之 后 才 把 结果 写 人 2 中 。 
10.2.6 对 投机 执行 的 支持 

内 存 加 载 指 令 是 能 够 从 投机 执行 中 获得 很 大 好 处 的 指令 类 型 。 当 然 , 内 存 加 载 是 很 常见 
的 。 它 们 有 比较 长 的 执行 延 时 ,加载 指 令 中 使 用 的 地 址 通常 可 以 预先 知道 , 且 结果 可 以 存放 
到 一 个 新 的 临时 变量 中 而 不 会 破坏 任何 其 他 变量 的 值 。 遗 憾 的 是 , 如 果 它 们 的 地 址 是 非法 的 ， 
内 存 加 载 可 能 会 引发 异常 ,因此 投机 性 地 访问 非法 地 址 可 能 会 使 一 个 正确 的 程序 意外 地 停止 
执行 。 另 外 , 预测 错误 的 内 存 加 载 可 能 引起 额外 的 高 速 缓存 脱 靶 和 页 面 错 误 ,， 这 些 问题 的 代 
价 都 非常 大 。 


在 代码 片段 


if (p != null) 
q= *p; 


中 , WA p 的 值 是 nul1, 投机 性 地 对 p 解 引用 可 能 会 使 得 正确 的 程序 停止 执行 。 

很 多 高 性 能 处 理 器 都 提供 了 特殊 的 功能 来 支持 投机 性 内 存 访问 。 下 面 我 们 给 出 其 中 一 些 最 
重要 的 特殊 功能 。 

预 取 指令 

人 们 发 明了 预 取 (prefetch) 指令 ,以 便 在 数据 被 使 用 之 前 将 其 从 内 存 移动 到 高 速 缓存 。 一 个 
预 取 指令 向 处 理 器 表明 该 程序 可 能 很 快 就 要 使 用 特定 内 存 字 。 如 果 指 定 的 内 存 位 置 不 可 用 , 或 
者 访问 该 位 置 会 引起 页 面 错误 , 那么 处 理 器 可 以 直接 忽略 这 个 指令 。 和 否则 , 如 果 该 数据 不 在 高 速 
缓存 中 , 处 理 器 将 把 该 数据 从 内 存 移动 到 高 速 缓存 。 
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毒药 位 

另 一 个 体系 结构 特征 被 称 为 毒药 位 ( poison bit) 。 人 们 发 明 毒药 位 以 便 投 机 性 地 把 数据 从 内 
存 加 载 到 寄存 器 文件 。 该 机 器 上 的 每 个 寄存 器 都 增加 了 一 个 毒药 位 。 如 果 访 问 了 非法 内 存 ,或 
者 被 访问 的 页 面 不 在 内 存 中 , 处 理 器 并 不 立刻 引发 异常 ,而 是 仅仅 设置 目标 寄存 器 的 毒药 位 。 只 
有 当 其 毒药 位 被 置 位 的 寄存 器 中 的 内 容 被 使 用 时 才 会 引发 一 个 异常 。 

带 断言 的 执行 


因为 分 支 运算 的 开销 很 大 ,而 预测 错误 的 分 支 的 开销 更 大 ( 见 10.1 节 )， 人 们 发 明了 带 断 言 
的 指令 (predicated instruction) 以 减少 一 个 程序 中 的 分 支 数量 。 一 条 带 断 言 的 指令 和 一 条 普通 指令 
类 似 , 但 是 它 有 一 个 额外 的 断言 运算 分 量 , 作为 它 的 执行 条 件 。 只 有 在 该 断言 被 满足 时 指令 才 会 
执行 o 7 
例如 ,一 个 带 条 件 的 移动 指令 CMOVZz R2, R3, R1 的 语义 是 只 有 当 寄 存 器 R1 的 值 为 零 时 寄 
FRR WNBA SS BIA RZ, Rika db c Ml d 分别 分 配 到 寄存 器 R1 、R2 、R4 、R5 中 ， 





下 面 的 代码 
if (a == 0) 
b = ctd; 


可 以 使 用 如 下 两 条 机 器 指令 实现 : 
ADD R3, R4, R5 
CMOVZ R2, R3, Ri 


这 个 转换 把 一 系列 具有 控制 依赖 关系 的 指令 蔡 换 为 只 有 数据 依赖 关系 的 指令 。 蔡 换 后 的 这 些 指 
令 可 以 和 相 邻 的 基本 块 合并 , 形成 更 大 的 基本 块 。 更 重要 的 是 , 使 用 这 些 代码 , 处理 器 就 不 会 产 
生 预 测 错误 , 因此 保证 了 指令 流水 线 的 平滑 运行 。 

带 断 言 的 执行 也 是 有 代价 的 。 即 使 最 后 不 需要 执行 带 断 言 的 指令 ,处 理 咒 也 必须 获取 该 指 
令 并 解码 。 静 态 调度 器 必须 保留 执行 它们 所 需要 的 资源 ,并 保证 所 有 可 能 的 数据 依赖 都 得 到 满 
足 。 除 非 机 器 拥有 的 资源 大 大 多 于 不 使 用 带 断 言 指令 时 所 需要 的 资源 ,否则 不 应 该 过 度 使 用 带 
断言 指令 。 





动态 调度 机 器 

使 用 静态 调度 的 机 器 的 指令 集 明确 地 定义 了 哪些 指令 可 以 并 行 执 行 。 但 是 , 回顾 一 下 
10.1.2 节 , 有 些 机 器 的 体系 结构 允许 到 运行 时 刻 再 确定 哪些 指令 可 以 并 行 运行 。 使 用 动态 调 
度 , 同样 的 机 器 代码 可 以 在 同一 系列 的 不 同 机 器 上 运行 。 这 些 机 器 实现 了 同样 的 指令 集 , 但 
是 拥有 不 同 数量 的 并 行 执行 支持 设施 。 实 际 上 , 机 器 代码 级 的 兼容 是 动态 调度 机 器 的 一 个 主 
要 优点 。 

用 软件 方式 在 编译 器 中 实现 的 静态 调度 器 可 以 帮助 (用 机 器 硬件 实现 的 ) 动态 调度 器 更 
好 地 利用 机 器 资源 。 在 为 一 个 动态 调度 机 器 构造 一 个 静态 调度 器 时 ,我 们 几乎 可 以 照搬 为 静 
态 调度 机 器 设计 的 调度 算法 ,只 是 新 算法 不 需要 明确 地 生成 原 算 法 放置 在 调度 方案 中 的 no- 
op 指令 。 这 个 问题 将 在 10.4.7 中 进一步 讨论 。 














10. 2.7 一 个 基本 的 机 器 模型 

很 多 机 器 可 以 使 用 下 面 的 简单 模型 表示 。 一 个 机 器 M = <R,T> 由 下 列 元 素 组 成 : 

1) 一 个 运算 类 型 的 集合 7。 这 些 运 算 类 型 包括 加 载 、 保存、 算术 运算 等 。 

2) 一 个 代表 硬件 资源 的 向 量 R= [7 ,rs,…], 其 中 7 表示 第 i 种 资源 的 可 用 单元 的 数目 。 典 
型 资源 的 例子 包括 : 内 存 访问 单元 、 算 术 逻 辑 单元 (ALU) 和 浮 点 功能 单元 。 
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每 条 指令 具有 一 组 输入 运算 分 量 、 一 组 输出 运算 分 量 和 一 个 资源 需求 。 每 一 个 输入 运算 
分 量 都 有 一 个 对 应 的 输入 延 时 。 这 个 延 时 表示 输入 值 (相对 于 运算 开始 时 刻 ) 必须 在 什么 时 候 
可 用 。 典 型 的 输入 运算 分 量 的 延 时 是 零 ， 表 明 立 刻 就 需要 使 用 这 些 值 。 类 似 地 ， 每 个 输出 运 
算 分 量 有 一 个 对 应 的 输出 延 时 。 这 个 延 时 表明 了 运算 结果 (相对 于 运算 开始 时 刻 ) 什 么 时 候 
可 用 。 

每 个 1 类 型 的 机 器 运算 指令 需要 使 用 的 资源 可 以 建 模 为 一 个 二 维 的 资源 预约 表 ( resource-res- 
ervation table) ，RT,。 该 表 的 宽度 是 机 器 中 资源 的 种 类 数量 , 它 的 长 度 是 该 运算 使 用 资源 的 时 间 
长 度 。 表 格 中 的 条 目 RT,[i, 咱 表示 在 i 类 型 的 运算 指令 被 发 出 i 个 时 钟 周期 后 该 运算 指令 占用 的 
第 j 种 资源 的 数量 。 为 了 简化 表示 方法 , 如果“ 指向 一 个 表格 中 不 存在 的 条 目 ( 也 就 是 比 执行 该 
运算 所 需 的 时 钟 数 大 ), 我 们 假定 RT,[i, 站 =0。 当 然 , 对 于 任何 1、i 和 j, RT,[i, 让 必须 小 于 或 等 
FR), 也 就 是 该 机 器 拥有 的 第 j 种 资源 的 总 数 。 

典型 的 机 器 运算 指令 在 其 被 发 出 时 只 占用 一 个 单元 的 资源 。 有 些 运算 可 能 使 用 多 个 功能 单 
元 。 比 如 , 一 个 相 乘 再 相 加 的 指令 可 能 在 第 一 个 时 钟 周 期 使 用 一 个 乘法 器 , 在 第 二 个 周期 使 用 一 


pipelined) 的 运算 是 指 那些 在 每 个 时 钟 周期 都 可 以 发 出 一 条 指令 的 运算 ,虽然 这 些 运算 的 结果 可 
能 要 等 到 几 个 时 钟 周 期 之 后 才 可 用 。 我 们 不 需要 明确 地 对 一 条 流水 线 的 各 个 阶段 的 资源 建 模 ， 
只 需要 用 一 个 单元 对 第 一 个 阶段 建 模 就 可 以 了 。 占 用 了 某 条 流水 线 的 第 一 阶段 的 运算 一 定 能 够 
在 下 一 个 时 钟 周 期 进入 下 一 个 阶段 。 
10.2.8 10.2 THAJ 

练习 10.2.1: 图 10-5 中 的 多 个 赋值 语句 具有 某 些 依赖 关系 。 对 于 下 列 的 每 个 语句 对 , 将 它们 
之 间 的 依赖 关系 按照 下 列 四 种 情况 进行 分 类 。(1) 真 依赖 ,(2) 反 依 








赖 ，(3) 输 出 依赖 ，(4) 无 依赖 关系 ( 即 两 条 指令 可 以 按照 任何 顺序 eee 
出 现 ) 。 
1) 语句 (1) 和 (4) 。 Sema 
2) 语句 (3) 和 (5)。 6) a = b 











3) 语句 (1) 和 (6) 。 
4) 语句 (3) 和 (6)。 
5) 语句 (4) 和 (6)。 
练习 10. 2. 2: 严格 按照 括号 顺序 ( 即 不 使 用 交换 律 和 结合 律 来 改变 加 法 的 顺序 ) 对 表达 式 
((w+v) + (w+%x))+(y+z) 求 值 。 给 出 寄存 器 层次 的 机 响 代 码 , 要 求 此 代码 具有 尽 可 能 大 的 并 


图 10-5 一 组 展示 了 数据 
依赖 性 的 赋值 语句 序列 











行 性 。 
o 1) LD ripi // ri=u 
练习 10. 2.3: 对 下 列表 达 式 重复 练习 10. 2. 2。 2) LD x2, v J/ r2 = 
1) (ut+ (ut (w+x)))+(y+z) : a ase i e 
2) (u+(v+w))+(x+(y+z)) 5) LD r3, x // r3=%x 
oC EL Be i Es, el ropa x . 6) ADD r2, r2, r3 // r2 = 312+ 273 
如 果 我 们 不 是 要 把 并 行 性 最 大 化 ,而 是 要 最 D ADD EL. ri r2 7/7 a S 
小 化 所 用 的 寄存 器 数目 ,这 个 计算 过 程 将 执行 多 8) LD r2，y // r2 =y 
`g sb z= = ZS 9 Dr3, z = 
少 步 ? 通过 将 并 行 性 最 大 化 , 我 们 省 下 了 多 少 | 10) goed. v3 7 aa ners 
步骤 ? 11) ADD ri, ri, r2 // ri = ri + r2 
练习 10.2.4; 练习 10.2.2 中 的 表达 式 可 以 使 





用 图 10-6 中 的 指令 序列 来 执行 。 如 果 我 们 有 足够 D a 
多 的 并 行 机 制 , 执行 这 些 指令 需要 多 少 步 ? oe 
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! 练习 10.2.5: 使 用 10. 2.6 节 中 的 条 件 拷贝 指令 CMOVZ 来 翻译 例 10. 4 中 的 代码 片断 。 机 
器 代码 中 的 数据 依赖 关系 是 什么 ? 


10.3 HARRIE 


我 们 现在 可 以 开始 讨论 代码 调度 算法 了 。 我 们 从 最 简单 的 问题 开始 : 对 一 个 由 机 器 指令 组 
成 的 基本 块 进行 调度 。 给 出 这 个 问题 的 最 优 解 的 复杂 度 是 NP 完全 的 。 但 是 在 实践 中 , 一 个 典型 
的 基本 块 只 有 少量 相互 之 间 高 度 约束 的 运算 ,因此 使 用 简单 的 调度 算法 就 足够 了 。 我 们 将 介绍 
一 个 称 为 列表 调度 (list scheduling) 的 简单 且 非 常 高 效 的 算法 来 解决 这 个 问题 。 

10.3.1 数据 依赖 图 

我 们 把 每 个 由 机 器 指令 组 成 的 基本 抉 表示 成 为 一 个 数据 依赖 图 (data-dependence graph), G = 
(N,E), 其 中 结 点 集合 N 表示 基本 块 中 机 器 指令 的 运算 , 而 有 向 边 集合 电表 示 运 算 之 间 的 数据 依 
赖 约束 。G 的 结 点 集合 和 边 集 按照 如 下 方式 构造 ; 

1) 在 NN 中 的 每 个 运算 n 有 一 个 资源 预约 表 RT, 其 值 就 是 n 的 运算 类 型 所 对 应 的 资源 预 
约 表 。 

2) E 中 的 每 条 边 e 有 一 个 表示 延 时 的 标号 d。。 该 标号 表明 目标 结 点 必须 在 源 结 点 发 出 后 至 
少 d 个 时 钟 周期 之 后 发 出 。 假 设 运算 n 之 后 跟 有 运算 n, 并 且 两 条 指令 访问 同一 个 内 存 位 置 ， 
访问 的 延 时 分 别 为 hi 和 1,。 也 就 是 说 , 该 位 置 上 的 值 在 第 一 条 指令 开始 之 后 的 第 4 个 时 钟 周期 
ER, 且 第 二 条 指令 在 其 开始 后 的 第 ls 个 时 钟 周期 需要 这 个 值 。 请 注意 , 在 通常 情况 下 /i =1 而 
1, =0, BBA, E 中 有 一 个 延 时 标号 为 4 -h 的 边 ni 一 ns。 

URE 考虑 一 个 可 以 在 每 个 时 钟 周期 内 执行 两 个 运算 的 机 器 。 其 中 第 一 个 运算 必须 是 分 支 
运算 或 者 以 下 形式 的 ALU 运算 : 

OP dst, srci, src2 
第 二 个 运算 必须 是 如 下 形式 的 加 载运 算 或 者 保存 运算 : 


LD dst, addr 
ST addr, src 


其 中 的 加 载运 算 (LD) 是 完全 流水 线 化 的 并 占用 两 个 时 钟 周期 。 但 是 , 一 个 加 载运 算 后 面 可 
以 立刻 跟 一 个 向 被 读 内 存 地 址 进行 写 运算 的 保存 运算 ST。 所 有 其 他 的 运算 都 在 一 个 时 钟 周 期 内 
完成 。 








资源 预约 表 的 图 示 方 法 

把 一 个 运算 的 资源 预约 表 用 实心 和 空心 方块 组 成 的 网 格 可 视 化 地 表示 出 来 是 非常 有 用 
的 。 在 网 格 中 , 每 一 列 对 应 于 目标 机 器 上 的 一 种 资源 ， 而 每 一 行 表示 该 运算 执行 中 的 一 个 时 
钟 周期 。 假 设 对 于 每 种 类 型 的 资源 , 这 个 运算 最 多 只 需要 一 个 单元 , 我 们 就 可 以 使 用 实心 方 
块 表示 1, 用 空心 方块 表示 0。 另 外 ,如 果 该 指令 是 完全 流水 线 化 的 , 那么 只 需要 指明 在 第 一 
行 中 使 用 的 资源 ,相应 的 资源 预约 表 变 成 了 单独 的 一 行 。 

例如 , 这 个 表示 方式 在 例 10.6 中 使 用 。 在 图 10-:7 中 ,我们 可 以 看 到 各 个 资源 预约 表 都 是 
单行 的 。 甚 中 的 两 个 加 法 运算 需要 “atu” 资 源 , 而 加 载 和 保存 运算 需要 “mem” 资 源 。 








图 10-7 中 显示 的 是 一 个 基本 块 例子 的 依赖 图 和 它 的 资源 需求 。 我 们 可 以 想像 R1 是 一 个 栈 
指针 , 用 来 通过 诸如 0 或 者 12 这 样 的 偏 移 量 访问 栈 中 的 数据 。 第 一 条 指令 向 寄存 器 R2 中 加 载 数 


据 ， 直 到 两 个 时 钟 周期 之 后 这 个 数据 才 变 得 在 R2 中 可 用 。 这 就 是 从 第 一 条 指令 到 第 二 及 第 五 条 
指令 的 边 的 标号 为 2 的 原因 , 这 两 条 指令 都 需 
要 R 中 的 值 。 类 似 地 ,从 第 三 条 指令 到 第 四 
条 指令 的 边 也 有 标号 表明 延 时 为 2; 第 四 条 指 | 





数据 依赖 关系 资源 预约 表 


alu mem 
















令 需要 被 加 载 到 R3 中 的 值 ， 而 这 个 值 要 在 第 ro R2,0GI) | = 
三 条 指令 开始 之 后 两 个 时 钟 周期 才 变 得 可 用 。 y i 





因为 我 们 不 知道 R1 和 R7 的 值 之 间 有 什 2/ LST ART) Re | 
么 样 的 关系 , 所 以 不 得 不 考虑 地 址 8(R1 ) 和 地 
址 0(R1) 相 同 的 可 能 性 。 也 就 是 说 , 最 后 一 条 
指令 可 能 正在 把 值 保存 到 第 三 条 指令 读 取 数 a a 








LD R3,8(R1) 








据 的 位 置 。 我 们 正 使 用 的 机 器 模型 允许 我 们 = 4 
在 从 某 个 位 置 开始 读 取 数据 的 一 个 时 钟 周期 oe 
之 后 把 数据 存放 到 这 个 位 置 上 ， 即 使 被 读 出 的 ee 





数据 需要 再 等 一 个 时 钟 周期 才 出 现在 寄存 器 
: 中 。 这 就 是 从 第 三 条 指令 到 最 后 一 条 指令 的 
边 的 标号 为 1 的 原因 。 这 也 同样 是 从 第 一 条 
指令 到 最 后 一 条 指令 有 一 条 标号 为 1 的 边 的 
原因 。 其 他 标号 为 1 的 边 产 生 的 原因 是 指令 图 10-7 例 10.6 的 数据 依赖 图 
间 的 数据 依赖 关系 , 或 者 当 R7 取 某 些 值 时 可 
能 产生 的 依赖 关系 。 口 
10. 3.2 基本 块 的 列表 调度 方法 

基本 块 调度 的 最 简单 的 方法 是 以 “ 带 有 优先 级 的 拓扑 排序 ”访问 数据 依赖 图 的 各 个 结 点 。 因 
为 一 个 数据 依赖 图 中 不 可 能 有 环 ,因此 总 是 至 少 存在 一 个 各 个 结 点 之 间 的 拓扑 顺序 。 但 是 , 在 所 
有 可 能 的 拓扑 排序 中 , 有 些 排序 可 能 比 其 他 排序 更 好 。 我 们 将 在 10. 3. 3 节 中 讨论 选择 拓扑 排序 
的 一 些 策 略 。 但 是 现在 我 们 仅仅 假设 存在 某 种 算法 来 选择 一 个 较 好 的 拓扑 排序 。 

下 面 我 们 将 讨论 的 列表 调度 算法 按照 被 选中 的 带 优先 级 的 拓扑 排序 访问 各 个 结 点 。 最 后 ， 
这 些 结 点 并 不 一 定 按照 它们 被 访问 的 顺序 进行 调度 。 但 是 指令 被 尽 可 能 早 地 放置 在 调度 方案 中 ， 
因此 指令 被 调度 的 顺序 往往 和 它们 被 访问 的 顺序 差不多 。 

更 详细 地 讲 , 算法 根据 每 个 结 点 和 之 前 已 调度 的 结 点 之 间 的 数据 依赖 约束 , 计算 出 能 够 执行 
该 结 点 的 最 早 时 间 位 置 。 然 后 , 算法 根据 一 个 资源 预约 表 来 检验 该 结 点 所 需要 的 资源 是 否 得 到 
满足 。 这 个 资源 预约 表 收 集 了 至 今 已 经 分 配 出 去 的 资源 的 信息 。 该 结 点 被 安排 在 最 早 的 能 够 获 
得 足够 资源 的 时 间 位 置 上 。 

对 一 个 基本 块 进行 列表 调度 

输入 :一 个 机 器 - 资源 向 量 R= [rrn], 其 中 r 是 第 i 种 资源 的 可 用 单元 的 数 是 ; 一 个 数 
据 依 赖 图 G= (N,E)。N 中 的 每 个 运算 n 的 标号 是 它 的 资源 预约 表 RT, E 中 的 每 个 边 e = nym 
都 有 标号 de, KHT m 不 能 在 nl 执行 之 后 的 de 个 时 钟 周期 之 内 执行 。 

输出 : 一 个 调度 方案 $。 它 把 NN 中 的 每 个 运算 映射 到 时 间 位 置 中 。 各 个 运算 在 方案 所 确定 的 
时 间 位 置 开始 执行 , 就 可 以 保证 所 有 的 数据 依赖 关系 和 资源 约束 都 得 到 满足 。 

方法 : 执行 图 10-8 中 的 程序 。 关 于 什么 是 “ 带 优先 级 的 拓扑 排序 ”的 讨论 将 在 10. 3.3 节 中 
给 出 。 


ST 12(R1),R3 
1 














ST 0(R7),R7 








46] 








S(n) = s; 
for (所 有 了 


} 





10.3.3 带 优先 级 的 拓扑 排序 


列表 调度 算法 不 会 回溯 ， 它 对 每 个 结 点 进行 一 次 且 只 进行 一 次 指令 调度 。 


while (存在 使 
3 二 3 十 
/进一步 把 这 个 指令 后 延 ， 下 到 所 需 资 源 


RT = 一 个 空 的 资源 预约 表 ; 
for (按照 带 优 先 级 的 拓扑 排序 访问 六 中 的 每 个 结 点 于 
3 三 Iaxe=pn in 

/* 根据 一 个 指令 的 各 个 前 驱 在 何 时 开始 ， 

计算 这 个 指令 最 时 可 以 在 何 时 开始 */ 

得 RT[s +1] + RTa[i] > R) 


£(5(p) + de); 





都 变 得 可 用 为 止 */ 


RT|s +i] = RT(s + i] + RTali) 


一 个 列表 指令 调度 算法 


) 





a ee E 


图 10-8 


它 使 用 一 个 启发 


式 的 优先 级 函数 来 从 已 经 就 绪 的 结 点 中 选择 下 一 个 调度 的 结 点 。 下 面 是 一 些 关 于 结 点 的 所 有 可 


能 的 带 优先 级 的 拓扑 排序 的 性 质 : 


e 如 果 不 考 虑 资源 约束 ,最 短 的 调度 方案 可 以 根据 关键 路 径 ( critical path) 给 出 。 所 谓 关 键 
路 径 就 是 数据 依赖 图 中 的 最 长 路 径 。 一 个 可 以 被 用 作 优 先 级 函数 的 度量 是 结 点 的 高 度 
(height) ， 就 是 从 这 个 结 点 开始 的 最 长 路 径 的 长 度 。 

e 从 另 一 方面 考虑 ,如果 所 有 的 运算 都 是 独立 的 , 那么 调度 方案 的 长 度 受 到 可 用 资源 的 约 
束 。 关 键 资源 就 是 具有 最 大 的 资源 使 用 /可 用 数量 比值 的 资源 。 所 谓 资 源 使 用 /可 用 数量 
比值 是 指 对 资源 的 使 用 和 可 用 资源 的 单元 数目 的 比值 。 使 用 较 多 关键 资源 的 运算 具有 和 较 


高 的 优先 级 。 


现 的 运算 应 该 首先 被 安排 。 





保存 运算 结束 。 这 条 路 径 中 的 所 有 边 上 
的 总 延 时 是 5, 此 外 我 们 还 要 再 加 上 执 
行 最 后 一 条 指令 所 需 的 1 个 时 钟 周期 。 
使 用 结 点 高 度 作为 优先 级 函数 , 算 
法 10.7 找到 了 一 个 如 图 10-9 所 示 的 优 
化 的 调度 方案 。 请 注意 ,因为 R3 的 加 
载 具有 最 大 的 高 度 , 因此 安排 这 条 指令 
首先 执行 。R3 和 R4 的 加 法 在 第 二 个 
时 钟 周期 就 有 足够 的 资源 , 但 是 一 条 加 
载 指令 有 2 个 时 钟 周 期 的 延 时 ,因此 我 


中 已 经 保存 了 需要 的 值 。 
10.3.4 10.3 节 的 练习 


A> ke 


调度 方案 

















最 后 , 我 们 可 以 使 用 源 代码 中 的 顺序 来 解决 运算 之 间 难 分 先后 的 问题 , 在 源 程序 中 先 出 


对 于 图 10-7 中 的 数据 依赖 关系 , 它 的 关键 路 径 的 (包含 了 执行 最 后 一 条 指令 的 时 间 ) 


长 度 是 6 个 时 钟 周期 。 也 就 是 说 , 关键 路 径 是 最 后 的 五 个 结 点 , 从 R3 的 加 载运 算 开 始 到 对 R7 的 


资源 预约 表 


alu mem 





R3,8(R1) 








— 
ADD R3,R3,R4 


R2,0(R1) 
_| 





ADD R3,R3,R2 


| 
4(R1),R2 











12(R1),R3 


O(R7),R7 | 

















图 10-9 ”将 列表 调度 算法 应 用 到 图 10-7 后 得 到 的 结果 
们 把 这 个 加 法 安排 到 第 三 个 时 钟 周期 。 也 就 是 说 , 在 第 3 个 时 钟 周期 开始 之 前 我 们 不 能 保证 R3 


练习 10. 3. 1: 对 于 图 10-10 中 的 每 个 代码 片段 , 画 出 数据 依赖 图 。 


o 
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1) LD R1，a LD R1, a LD R1, a 
2) LD R2, b LD R2, b LD R2, b 
3) SUB R3, R1, R2 SUB Ri, Ri, R2 SUB R3, R1, R2 
4) ADD R2, R1, R2 ADD R2, R1, R2 ADD R4, R1, R2 
5) ST a, R3 ST a, Ri ST a, R3 
6) ST b, R2 ST b, R2 ST b, R4 








a) b) 
E 10-10 练习 10.3.1 的 机 器 代码 


练习 10.3.2: 假设 一 个 机 器 具有 一 个 ALU 资源 (用 于 ADD 和 SUB 运算 ) 和 一 个 MEM 资源 
(用 于 LD 和 ST 运算 ) 。 假 设 除 了 LD 运算 需要 两 个 时 钟 周 期 之 外 ， 其 余 所 有 运算 都 只 需要 一 个 
时 钟 周期 。 但 是 , 如 例 10.6 中 所 说 , 在 一 个 对 某 内 存 位 置 的 LD 运算 执行 一 个 时 钟 周期 之 后 就 可 
以 执行 对 同一 个 位 置 的 ST 运算 。 为 图 10-10 中 的 每 个 代码 片断 寻找 一 个 最 短 调度 方案 。 

练习 10. 3. 3: 在 如 下 假设 下 重复 练习 10.3.2, 

1) 该 机 器 具有 一 个 ALU 资源 和 两 个 MEM 资源 。 

2) 该 机 器 具有 两 个 ALU 资源 和 一 个 MEM 资源 。 

3) 该 机 器 具有 两 个 ALU 资源 和 两 个 MEM 资源 。 

练习 10.3.4: 使 用 例 10.6 中 的 机 器 模型 (和 练习 10.3.2 一 
FE): 

1) 为 图 10-11 中 的 代码 画 出 数据 依赖 图 。 

2) 对 于 问题 (1) 得 到 的 数据 依赖 图 , 全 部 关键 路 径 包 括 哪 些 ? A 10-11 练习 10.3.4 的 























调度 方案 是 什么 ? 


10.4 ”全 局 代码 调度 

对 于 一 个 具有 中 等 数量 的 指令 并 行 机 制 的 机 器 , 通过 压缩 各 个 基本 块 而 得 到 的 调度 方案 往 
往 会 留 下 很 多 空闲 的 资源 。 为 了 更 好 地 利用 机 器 资源 ， 有 必要 考虑 把 一 些 指令 从 一 个 基本 块 移 
动 到 另 一 个 基本 块 的 代码 生成 策略 。 同 时 考虑 多 个 基本 块 的 策略 称 为 全 局 调度 (global schedu- 
ling) 算法。 为 了 正确 地 进行 全 局 调度 , 我们 需要 考虑 的 问题 不 仅 包括 数据 依赖 关系 ,还 包括 控制 
依赖 。 我 们 必须 保证 

1) 所 有 在 原 程序 中 执行 的 指令 都 会 在 优化 后 的 程序 中 运行 , 并 且 

2) 虽然 优化 后 的 程序 可 以 投机 性 地 执行 一 些 额外 指令 , 但 这 些 指令 不 能 产生 任何 有 害 的 副作用 。 
10. 4. 1 基本 的 代码 移动 

让 我 们 首先 通过 一 个 简单 的 例子 来 研究 一 下 指令 移动 可 能 涉及 的 问题 。 
OEG 假设 我 们 有 一 个 可 以 在 单个 时 钟 周期 内 同时 执行 任意 两 条 指令 的 机 器 。 除 了 加 载运 
算 有 两 个 时 钟 周期 的 延 时 外 ， 其余 每 个 运算 的 执行 延 时 为 一 个 时 钟 周期 。 为 简单 起 见 ,我 们 假设 
例子 中 所 有 的 内 存 访问 都 是 正确 的 , 且 访 问 的 数据 都 在 高 速 缓存 中 。 图 10-12a 显示 了 一 个 包括 
三 个 基本 块 的 简单 流 图 。 其 中 的 代码 被 扩展 为 图 10-12b 所 示 的 机 器 指令 。 因 为 数据 依赖 关系 ， 
每 个 基本 块 中 的 所 有 指令 必须 顺序 执行 。 实 际 上 ,每 个 基本 块 中 都 必须 插 人 一 个 no-op 指令 。 

假设 变量 abcd 和 e 的 地 址 互 不 相同 ,并 且 这 些 地 址 被 分 别 存放 在 寄存 器 RL ~- R5 中 。 因 
此 不 同 基本 块 中 的 计算 之 间 没 有 数据 依赖 关系 。 我 们 发 现 , 不 管 是 否 选择 图 中 的 分 支 跳 转 ， 基 本 
RB, 中 的 所 有 运算 都 会 被 执行 , 因此 它 可 以 和 基本 块 有 中 的 运算 并 行 执行 。 我 们 不 能 把 Bi 中 
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的 运算 移动 到 83 ， 因 为 需要 它们 来 决定 分 支 跳 转 的 出 口 。 





By 


LD R6,0(R1) 
nop 
BEQZ R6,L 











LD R7,0(R2) 


nop 
ST 0(R3),R7 


















if (a==0) goto L 

















L:| LD R8,0(R4) Bs 
nop 
ADD R8,R8,R8 
L: ST 0(R5),R8 
| e = dtd 
a) 源 程 序 b) 局 部 调度 得 到 的 机 器 代码 





B 
LD R6,0(R1), LD R8,0(R4) $ 
LD R7,0(R2) 

ADD R8,R8,R8, BEQZ R6,L 


L: Pe es By’ 
ST 0(R5),R8 ST 0(R5),R8, ST 0(R3),R7 


c) 金 局 调度 得 到 的 机 器 代码 

















图 10-12 $110.9 中 全 局 调度 之 前 利之 后 的 流 图 


B, 中 的 运算 和 基本 块 B; 中 的 测试 指令 之 间 具 有 控制 依赖 关系 。 我 们 可 以 在 基本 块 Bi 中 投 
机 性 执行 By 中 的 加 载运 算 而 不 会 产生 任何 附加 开销 , 并 且 只 要 该 分 支 执行 , 就 可 以 节约 两 个 时 
钟 周期。 

保存 运算 不 应 该 投机 性 地 执行 , 因为 它们 覆 写 了 某 个 内 存 位 置 上 的 原 值 。 但 是 可 以 延迟 执 
行 一 个 保存 运算 。 我 们 不 能 直接 把 B 中 的 保存 运算 放 到 基本 块 B 中 , 因为 只 有 当 控 制 流 经 过 
HA B 时 才能 执行 这 个 保存 运算 。 但 是 , 我 们 可 以 把 保存 运算 放 在 Bs 的 一 个 拷贝 中 。 
图 10-12c 中 显示 了 经 过 这 样 优化 后 的 调度 方案 。 优 化 后 的 代码 在 4 个 时 钟 周 期 内 执行 完毕 , 这 
和 单独 执行 基本 块 B 所 需 的 时 间 一 样 。 o 

例 10. 9 表明 我 们 可 以 沿 着 一 个 执行 路 径 上 下 移动 指令 。 在 这 个 例子 中 , 每 一 对 基本 块 都 有 
一 个 不 同 的 "支配 关系 ”“， 因 此 关于 何 时 以 及 如 何在 每 一 对 基本 块 之 间 移动 指令 的 考虑 是 不 同 的 。 
如 9.6.1 节 中 所 讨论 的 , 如果 每 一 个 从 控制 流 图 人 口 处 到 达 基 本 块 8 的 路 径 都 经 过 一 个 基本 据 
B, 那么 就 认为 有 支配 B'。 类 似 地 , 如 果 从 有 到 达 流 图 出 口 处 的 路 径 都 经 过 也 ,我 们 说 妃 反 向 支 
配 (postdominate) B'。 当 8 支 配 B' 并 且 B8' 反 向 支配 B 的 时 候 , 我 们 就 说 B 和 B' 是 控制 等 价 的 
(control equivalent), 其 含义 是 一 个 基本 块 会 被 执行 当 且 仅 当 另 一 个 基本 块 也 会 被 执行 。 对 于 图 
10-12 中 的 例子 ,假设 B, 是 流 图 入 口 , 且 B 是 出 口 , 则 

1) B, 和 Bs 是 控制 等 价 的 : By 支配 Bs 而 B, 反 向 支配 B1。 

2) B, 支配 B,, 但 是 B, 不 反 向 支配 Bo 

3) B, 不 支配 B 但 是 By 反 向 支配 By. 

在 一 条 路 径 上 的 一 对 基本 块 之 间 也 可 能 既 不 具有 支配 关系 ， 也 不 具有 反 向 支配 关系 。 
10.4.2 ”向 上 的 代码 移动 | 

我 们 现在 仔细 考查 把 一 个 运算 沿 着 一 条 路 径 向 上 移动 意味 着 什么 。 假 设 我 们 希望 把 一 个 运 
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算 从 基本 块 sre 治 着 一 条 控制 流 路 径 向 上 移动 到 基本 块 dst。 同 时 假设 这 样 的 移动 没有 违反 任何 
数据 依赖 关系 , 并 且 使 得 从 dst 到 sre 的 路 径 运 行 得 更 快 。 如 果 dst 支配 ore 并 且 sre 反 向 支配 dst, 
那么 被 移动 的 运算 会 在 它 应 该 运行 的 时 候 被 恰好 运行 一 次 。 

如 果 src 不 反 向 支配 dst 

这 种 情况 下 ,存在 一 条 经 过 dst 但 是 没有 到 达 sre 的 路 径 。 此 时 会 执行 一 个 多 余 的 运算 。 除 
非 被 移动 的 运算 没有 任何 有 害 的 副作用 ,否则 这 个 代码 移动 就 是 非法 的 。 如 果 被 移动 的 运算 是 
“免费 "执行 的 ( 即 它 只 使 用 那些 本 来 会 被 闲置 的 资源 ) ,那么 这 次 代码 移动 没有 产生 开销 。 只 有 
当 控 制 流 到 达 sre 的 时 候 这 次 代码 移动 才 是 有 益 的 。 

如 果 dst 不 支配 src 

这 种 情况 下 存在 一 条 没有 首先 经 过 dst 就 到 达 sre 的 路 径 。 我 们 需要 在 这 样 的 路 径 中 插 人 被 
移动 运算 的 拷贝 。 根 据 9. 5 节 中 对 部 分 元 余 消除 的 讨论 我 们 可 以 知道 如 何 准 确 做 到 这 一 点 。 我 
们 把 这 个 运算 的 拷贝 放置 在 一 组 基本 块 中 , 这 组 基本 块 形成 了 一 个 将 入 口 基 本 块 和 sre 分 割 开 的 
制 集 。 在 每 个 插入 这 个 拷贝 的 地 方 , 下 列 约束 必须 满足 : 

1) 该 运算 的 运算 分 量 必须 和 原 运算 的 运算 分 量具 有 相同 的 值 。 

2) 运算 的 结果 没有 覆盖 掉 可 能 在 后 面 使 用 的 值 。 

3) 此 运算 本 身 的 结果 没有 在 到 达 sre 之 前 被 覆盖 掉 。 

这 些 拷贝 使 得 sre 中 的 原 指 令 完 全 宛 余 ,因此 可 以 被 消除 。 

我 们 把 这 个 运算 指令 的 额外 拷贝 称 为 补偿 代码 ( compen sation code), 9.5 节 讨 论 过 , 可 以 在 
关键 边 上 插入 基本 块 来 放置 这 些 拷贝 。 补 偿 代码 可 能 使 得 某 些 路 径 的 执行 变 慢 。 因 此 ,只 有 当 
被 优化 路 径 的 执行 频率 高 于 其 他 未 被 优化 的 路 径 时 , 这 个 代码 移动 才 会 提高 程序 执行 的 性 能 。 
10.4.3 向 下 的 代码 移动 

假设 我 们 感 兴趣 的 是 把 一 个 运算 从 基本 块 se 沿 着 一 条 控制 流 路 径 向 下 移动 到 基本 块 dsi。 
我 们 可 以 像 上 面 介绍 的 那样 考虑 这 样 的 代码 移动 。 

如 果 src 不 支配 dst 

在 这 种 情况 下 , 存在 一 条 没有 先 访问 sre 就 到 达 dsi 的 路 径 。 同 样 , 在 这 种 情况 下 会 执行 一 个 
额外 的 运算 。 遗 憾 的 是 , 向 下 代码 移动 经 常用 于 写 运 算 。 这 种 运算 具有 副作用 , 会 覆盖 原来 的 
值 。 我 们 可 以 设法 绕 过 这 个 问题 , 方法 是 复制 从 sre 到 dst 的 路 径 上 的 基本 块 , 并 且 只 在 dst 的 新 
拷贝 中 放置 这 个 运算 。 另 一 个 方法 是 , 如 果 可 以 在 使 用 带 断 言 的 指令 时 使 用 这 种 指令 。 我 们 用 
基本 块 sro 的 卫 式 断言 作为 被 移动 运算 的 卫 式 断言 。 请 注意 , 这 些 带 断 言 的 指令 只 能 被 安排 在 由 
计算 该 断言 的 基本 块 所 支配 的 基本 块 中 , 否则 该 断言 的 值 会 不 可 用 。 

如 果 dst 不 反 向 支配 sre 





和 上 面 的 讨论 一 样 , 我 们 必须 插入 补偿 代码 以 使 得 被 移动 的 运算 在 所 有 没有 到 达 ds 的 路 径 
上 都 被 执行 了 。 这 个 转换 仍然 和 部 分 元 余 消 除 类 似 , 不 同 之 处 在 于 运算 的 拷贝 被 放置 在 基本 块 


sre 之 后 .把 sre 和 流 图 出 口 处 分 开 的 割 集中 。 

关于 向 上 和 向 下 代码 移动 的 总 结 l 

从 上 面 的 讨论 中 可 知 , 我 们 看 到 存在 一 组 可 能 的 全 局 代码 移动 的 方法 。 这 些 方法 的 收益 、 代 
价 以 及 实现 复杂 度 各 不 相同 。 图 10-13 中 给 出 了 这 些 代码 移动 方法 的 总 结 。 图 中 的 各 行 对 应 于 下 

1) 在 控制 等 价 的 基本 块 之 间 移 动 指 令 最 简单 且 性 价 比 最 高 。 不 需要 执行 额外 的 运算 , 也 不 
需要 补偿 代码 。 l 





2) 在 向 上 (向 下 ) 代 码 移动 中 , 如果 源 基 本 块 不 反 向 支配 (支配 ) 目标 基本 块 , 那么 就 可 能 需 


p 
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要 执行 额外 的 运算 。 当 该 额外 运算 能 够 免费 执行 并 且 通 过 源 基本 块 的 路 径 被 执行 时 ,这 个 代码 
移动 就 是 有 益 的 。 
3) 在 向 上 (向 下 ) 代码 移动 中 , 如 果 目 标 基本 块 不 支配 ( 反 向 支配 ) 源 基本 块 , 就 需要 补偿 代 


码 。 带 有 补偿 代码 的 路 径 的 运行 可 能 会 变 慢 , 因此 保证 被 优化 的 路 径 具 有 较 高 的 执行 频率 是 很 
重要 的 。 


4) 最 后 一 种 情况 把 第 二 和 第 三 种 情况 的 不 利之 处 合并 了 起 来 : 可 能 婚 需 要 执行 额外 运算 ， 
又 需要 补偿 代码 。 





HE: sre 反 向 支配 dst dst 支配 sre ”投机 
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图 10-13 ”代码 移动 的 总 结 


10.4.4 更 新 数据 依赖 关系 
如 下 面 的 例 10. 10 Pras, 代码 移动 可 能 会 改变 运算 之 间 的 数据 依赖 关系 。 因 此 在 每 次 代码 移 
动 之 后 都 必须 更 新 数据 依赖 关系 。 


对 于 图 10-14 中 显示 的 流 图 , 对 x 的 两 个 赋值 ete 




















之 一 可 以 被 向 上 移动 到 顶部 的 基本 块 ， 因 为 这 样 的 转换 保 | 2 

持 了 原 程序 中 的 所 有 依赖 关系 。 但 是 , 一 但 我 们 把 其 中 一 Ze 

个 赋值 语句 上 移 ， 就 不 能 再 移动 另 一 个 。 更 明确 地 说 ,我 

们 看 到 在 代码 移动 之 前 顶部 的 基本 块 的 出 口 处 x 是 不 活路 = 

的 , 但 是 在 移动 之 后 就 变 得 活路 了 。 如 果 一 个 变量 在 一 个 ”图 10-14 ”说明 因为 代码 移动 而 改变 
程序 点 上 活跃 , 那么 我 们 不 能 把 对 该 变量 的 投机 性 定 值 移 数据 依赖 关系 的 例子 

动 到 该 程序 点 的 前 面 。 o 





10.4.5 全 局 调度 算法 

在 上 一 节 中 , 我 们 看 到 代码 移动 对 某 些 路 径 有 益 , 但 
是 会 损害 另外 一 些 路 径 的 性 能 。 好 消息 是 指令 并 不 是 生 而 平等 的 。 实 际 上 , 我 们 知道 , 一 个 程序 
的 90% 以 上 的 执行 时 间 被 花 在 不 到 10% 的 代码 上 。 因 此 , 我 们 可 以 把 目标 确定 为 使 得 频繁 执行 
的 路 径 更 快运 行 , 虽然 有 可 能 降低 不 频繁 路 径 的 运行 速度 。 

编译 器 有 多 种 技术 来 估算 执行 频率 。 我 们 有 理由 假设 在 最 内 层 的 循环 中 的 指令 比 外 层 循环 
中 的 指令 执行 得 更 频繁 , 也 有 理由 假设 选择 向 回 跳 转 分 支 的 使 用 频率 高 过 不 选择 这 个 分 支 的 使 
用 频率 。 另 外 ,转向 程序 出 口 或 者 异常 处 理 例 程 的 分 支 不 大 可 能 被 选择 执行 。 但 是 , 最 好 的 频率 
估算 来 自 于 动态 获取 的 程序 运行 剖面 。 在 这 个 技术 中 , 程序 经 过 持 装 以 记录 程序 运行 时 刻 各 个 
条 件 分 支 的 出 口 选 择 情 况 。 然 后 , 程序 就 在 有 代表 性 的 输入 上 运行 ,确定 程序 总 体 的 运行 行为 。 
人 们 发 现 应 用 这 个 技术 得 到 的 结果 相当 精确 。 这 样 的 信息 可 以 反馈 给 编译 器 , 由 编译 器 在 甚 优 
化 过 程 中 使 用 。 

基于 区 域 的 调度 

现在 我 们 描述 一 个 简单 的 全 局 调度 器 , 它 支持 两 种 最 容易 的 代码 移动 ， 

1) 把 运算 向 上 移动 到 控制 等 价 的 基本 块 。 
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2) 把 运算 向 上 移动 一 个 分 支 , 移动 到 一 个 支配 前 驱 中 。 

9.7.1 节 介绍 过 , 一 个 区 域 是 一 个 控制 流 图 的 子 集 , 它 只 能 通过 一 个 人 口 基本 块 到 达 。 我 们 
可 以 把 任何 过 程 表示 为 一 个 区 域 的 层次 结构 。 顶 层 区 域 包 括 整 个 过 程 , TREC POE KRM 
代表 该 过 程 中 的 自然 循环 。 我 们 假设 控制 流 图 是 可 归 约 的 。 
C3) 1 基于 区 域 的 调度 。 

输入 : 一 个 控制 流 图 和 一 个 机 器 - 资源 描述 。 

输出 : 一 个 调度 方案 S。 它 把 每 条 指令 映射 到 一 个 基本 块 和 一 个 时 间 位 置 。 

方法 : 执行 图 10-15 中 的 程序 。 其 中 的 一 些 术语 缩写 的 含义 是 很 明显 的 : ControlEquiv( B) 表示 
和 基本 块 B 控制 等 价 的 基本 块 的 集 ， 























合 , 而 作用 于 一 个 基本 块 集合 的 for ER ca 使 得 内 层 区 域 先 于 
$ Fas [X.E IP 
DominatedSuce 表示 下 面 的 基本 块 集 { 计 算数 据 依赖 关系 ; 
个 个 of = An for (按照 带 优先 级 的 拓 提 排序 访问 R 中 的 每 个 基本 块 B ) { 
合 : 它们 是 该 基本 块 集合 中 一 个 或 多 CandBlocks = ControlEquiv( B) U 
个 基本 块 的 后 继 且 被 该 集合 中 的 所 DominatedSuce( ControlEquiv( B)); 
Ye: CandInsts = CandBlocks 中 已 可 以 被 调度 的 指令 ; 
有 基本 块 支配 。 for (t= 0,1,... 直到 B 中 的 所 有 指令 都 已 经 调度 完毕 ) { 
算法 10. 11 中 的 代码 调度 从 最 内 for ( 梳 照 优先 顺序 访问 Condinsts 中 的 每 个 指令 m ) 
aane Gets pean if (在 时 刻 t 上 没有 资源 冲突 
层 的 区 域 开始 逐渐 扩展 到 最 外 层 。 u at aa ae 
对 一 个 区 域 进行 调度 时 , 每 一 个 内 更 新 已 分 配 资源 的 信息 ; 
a man TAMER 
PRANK ABR 4 E-TRET, 指 } 
令 不 能 移 人 或 移出 某 个 子 区 域 。 但 } 更 新 CandInsts; 
E, 只 要 指令 的 数据 依赖 关系 和 控制 } 
依赖 关系 都 得 到 满足 , 我 们 可 以 绕 着 |) 
子 区 域 移动 这 些 指令 。 


图 10-15 ”一 个 基于 区 域 的 全 局 调度 算法 
算法 忽略 了 所 有 流 回 区 域 头 基 | 


本 块 的 控制 和 依赖 边 , 因此 最 后 得 到 的 控制 流 和 数据 依赖 图 都 是 无 环 的 。 对 每 个 区 域 中 的 各 基 
本 块 的 访问 遵守 拓扑 排序 。 这 个 顺序 保证 了 只 有 在 该 基本 块 所 依赖 的 所 有 指令 都 被 调度 好 之 后 
才 对 这 个 基本 块 进行 调度 。 将 被 安排 在 一 个 基本 块 B 中 的 指令 来 自 于 所 有 和 基本 块 8 控制 等 价 
WEAR (AEB), 以 及 这 些 等 价 基 本 块 的 ,被 B 支配 的 直接 后 继 。 

为 各 个 基本 块 创建 调度 方案 时 使 用 的 是 列表 调度 算法 。 该 算法 有 一 个 候选 指令 列表 Candin- 
sts ,这 个 列表 中 包含 了 候选 基本 块 中 的 所 有 其 前 驱 已 调度 好 的 指令 。 该 算法 逐个 时 钟 周 期 地 构造 
调度 方案 。 对 于 每 个 时 钟 周 期 , 它 按照 优先 级 顺序 检查 Candinsts 中 的 各 条 指令 , 在 资源 允许 的 
情况 下 把 指令 安排 在 该 时 钟 周 期 上 。 然 后 , 算法 10. 11 更 新 Candinsts 并 重复 这 个 过 程 , 直到 8B 中 
所 有 指令 都 被 安排 完毕 。 

CandInsts 中 的 指令 的 优先 级 顺序 所 使 用 的 优先 级 函数 和 10. 3 节 中 讨论 过 的 函数 类 似 。 然 
而 , 我 们 作 了 一 个 重要 的 修改 。 我 们 把 较 高 的 优先 级 赋予 那些 来 自 和 基本 块 B 控制 等 价 的 基本 
块 的 指令 , 而 对 来 自 于 后 继 基本 块 的 指令 赋予 较 低 的 优先 级 。 这 么 做 的 原因 是 后 一 种 类 型 的 指 
令 只 是 在 基本 块 B 中 被 投机 性 执行 。 T 

循环 展开 

在 基于 区 域 的 调度 中 , 一 个 循环 中 迭代 之 间 的 界限 是 代码 移动 的 障碍 。 来 自 一 个 迭代 的 运 
算 不 能 和 来 自 其 他 迭代 的 运算 重合 。 可 缓解 这 一 问题 的 简单 且 高 效 的 技术 是 在 代码 调度 之 前 少 
HARR AME. UNF AY for 循环 
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for (i = 0; i < N; i++) { 
SCi); 


























} for (i = 0; i+4 < N; it=4) { repeat { 
N S(i); S; 
可 以 被 写成 图 10-16a 所 示 的 代码 。 SG+1); if (C) break; 
oF s(i+2); = 
类 似 地 ， 如 下 的 repeat 循环 s(i+3); if (C) break; 
repeat } S; 
S; for ( ; i < N; i++) { if (C) break; 
until C; S(i); 8; 
可 以 被 写成 图 10-16b 所 示 的 代码 。 |? ee 
循环 展开 在 循环 体 中 产生 了 更 多 a) RIT — A for diay b) 展开 一 个 repeat 循 环 
指令 , 使 全 局 调度 算法 找到 更 多 . f 
nee es 图 10-16 循环 的 展开 
的 并 行 性 。 
. 相 邻 压缩 


算法 10. 11 只 支持 10.4. 1 节 中 描述 的 前 两 种 形式 的 代码 移动 。 需 要 引 人 和 人 补偿 代码 的 代码 移 
动 有 时 也 是 有 用 的 。 支 持 这 种 代码 移动 的 方法 之 一 是 在 基于 区 域 的 调度 之 后 再 跟 一 个 简单 的 处 
理 过 程 。 在 这 个 过 程 中 , 我 们 可 以 检查 各 对 连续 执行 的 基本 块 , 检查 是 和 否 有 运算 可 以 在 它们 之 间 
上 移 或 下 移 ,， 以 改进 这 些 基 本 块 的 执行 时 间 。 如 果 找 到 了 一 对 这 样 的 基本 块 , 我 们 检查 是 否 需 要 
在 别 的 路 径 中 复制 将 被 移动 的 指令 。 如 果 移 动 之 后 的 预期 收益 是 正 的 , 就 可 以 进行 这 样 的 代码 
移动 。 

这 个 简单 的 扩展 能 够 有 效 提高 循环 的 性 能 。 比 如 , 它 可 以 把 一 个 迭代 开始 处 的 运算 移动 到 
上 一 个 迭代 的 结尾 , 同样 也 可 以 把 运算 从 第 一 个 适 代 移动 到 循环 之 外 。 对 于 较 紧 密 的 循环 , 即 每 
个 迭代 过 程 只 执行 少量 指令 的 循环 , 这 种 优化 特别 具有 吸引 力 。 但 是 , 由 于 每 个 代码 移动 的 决定 
是 局 部 地 独立 做 出 的 ,因此 这 个 技术 的 效果 受到 一 定 的 限制 。 

10. 4.6 高 级 代码 移动 技术 

如 果 我 们 的 目标 机 器 是 静态 调度 的 , 并 且 具 有 丰富 的 指令 级 并 行 机 制 , 我 们 可 能 需要 更 加 积 
极 的 调度 算法 。 下 面 是 有 关 进 一 步 扩展 代码 移动 技术 的 一 些 高 级 描述 

1) 为 了 便于 进行 下 面 的 扩展 , 我 们 可 以 在 那些 从 具有 多 个 前 驱 的 基本 块 出 发 的 控制 流 边 上 
增加 新 的 基本 块 。 在 代码 调度 结束 后 将 删除 这 些 基 本 块 中 的 空 基 本 块 。 一 个 有 用 的 启发 式 规则 
是 试图 把 指令 移出 几乎 为 空 的 基本 块 , 使 得 这 个 基本 块 可 以 被 完全 删除 。 

2) 在 算法 10. 11 中 , 各 基本 块 内 执行 的 代码 在 此 基本 块 被 访问 时 一 次 性 调度 完毕 。 这 个 简 
单 的 方法 已 经 足够 了 , 因为 这 个 算法 只 能 够 把 运算 上 移 到 前 面 的 支配 基本 块 。 为 了 进行 需要 额 
外 补偿 代码 的 代码 移动 , 我 们 选用 了 一 个 略微 不 同 的 方法 。 当 我 们 访问 基本 块 8 的 时 候 , 只 对 B 
以 及 和 B 控制 等 价 的 基本 块 中 的 指令 进行 调度 。 我 们 首先 试图 把 这 些 指令 放置 到 之 前 已 经 被 访 
问 过 的 前 驱 基本 块 中 。 这 些 基本 块 已 经 有 了 一 个 部 分 调度 方案 。 我 们 试图 找到 一 个 目标 基本 块 ， 
使 得 移动 后 可 以 改进 一 个 频繁 执行 的 路 径 , 然后 在 其 他 路 径 上 放置 这 条 指令 的 拷贝 来 保证 移动 
的 正确 性 。 如 果 指 令 不 能 向 上 移动 , 那么 它们 和 以 前 一 样 在 当前 的 基本 块 中 进行 调度 。 

3) 在 以 拓扑 顺序 访问 基本 块 的 算法 中 , 实现 向 下 的 代码 移动 要 更 加 困难 一 些 , 原因 是 目标 
基本 块 还 在 等 待 调度 。 虽 然 机 会 较 少 , 但 还 是 存在 一 些 机 会 进行 这 样 的 代码 移动 。 我 们 会 移动 
所 有 同时 满足 下 列 条 件 的 运算 : 

@ 它们 可 以 被 移动 。 

@ 在 原来 的 基本 块 中 它们 不 能 免费 执行 。 

如 果 目 标 机 器 有 很 多 没有 使 用 到 的 硬件 资源 , 这 个 简单 的 策略 会 很 有 效 。 
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10.4.7 ”和 动态 调度 器 的 交互 

一 个 动态 调度 器 的 优势 是 它 可 以 根据 运行 时 刻 的 情况 产生 新 的 调度 方案 , 而 不 必 在 运行 之 
前 对 所 有 可 能 的 调度 进行 编码 。 如 果 目 标 机 器 有 一个 动态 调度 器 , 那么 静态 调度 器 的 主要 功能 
是 保证 尽 星 获 得 高 延 时 指令 , 使 得 动态 调度 器 可 以 尽早 发 出 这 些 指 令 。 

高 速 缓存 脱 妓 是 一 类 不 可 预测 的 事件 , 它们 可 能 使 得 程序 的 性 能 有 很 大 的 不 同 。 如 果 可 以 使 用 
数据 预 取 指令 , 那么 静态 调度 器 可 以 较 早 地 放置 这 些 预 取 指令 以 使 得 在 需要 相应 数据 时 ,数据 已 经 
在 高 速 缓存 之 中 。 静 态 调度 器 通过 这 种 方式 有 效 地 帮助 动态 调度 器 。 如 果 没 有 预 取 指令 可 用 , 编译 
器 可 以 估算 一 下 哪些 运算 可 能 会 发 生 高 速 缓存 脱 靶 , 并 试图 时 一 点 发 出 这 些 运 算 指令 。 

如 果 在 目标 机 絮 上 没有 动态 调度 机 制 , 静态 调度 器 必须 保守 地 处 理 调度 问题 , 把 每 对 具有 数据 依 
赖 关系 的 运算 分 开 , 使 它们 之 间 的 间隔 不 小 于 最 小 延 时 。 但 是 , 如 果 有 动态 调度 器 可 用 , 编译 器 只 需要 
把 具有 数据 依赖 关系 的 运算 指令 按照 正确 的 顺序 排列 ， 以 保证 程序 的 正确 性 。 为 了 得 到 最 佳 性 能 , 编 
译 器 应 该 给 较 有 可 能 发 生 的 依赖 赋予 较 长 的 延 时 , 给 不 大 可 能 发 生 的 依赖 赋予 较 短 的 延 时 。 

分 支 的 错误 预测 是 性 能 下 降 的 重要 原因 之 一 。 因 为 错误 预测 会 带 来 较 长 的 时 间 损 失 , Bb 
执行 路 径 上 的 指令 仍然 会 对 整个 执行 时 间 产 生 较 大 的 影响 。 所 以 , 应 该 给 这 类 指令 赋予 较 高 的 
优先 级 ,以便 降低 错误 预测 的 代价 。 

10.4.8 10.4 节 的 练习 
练习 10. 4. 1: 指出 如 何 展 开 一 般 的 while 循环 


while (C) 
S; 


【练习 10.4.2: 考虑 代码 片断 : 
if (x == 0) a = b; 
else a = Ci 
d = a; 


假设 有 一 个 机 器 使 用 了 例 10. 6 中 的 延 时 模型 ( 即 加 载运 算 需 要 两 个 时 钟 周期 ， 其 他 指令 需 
要 一 个 时 钟 周期 ) 。 同 时 假设 该 机 器 可 以 一 次 执行 任意 两 条 指令 。 为 这 个 片断 找 出 一 个 最 短 的 执 
行 方法 。 不 要 忘记 考虑 在 各 个 复制 步骤 中 使 用 哪个 寄存 器 最 好 。 同 时 , 记 住 利 用 8. 6 节 中 描述 的 
寄存 器 描述 符 所 提供 的 信息 ， 以 避免 不 必要 的 加 载 和 保存 运算 。 


10.5 软件 流水 线 化 


正如 在 本 章 的 引言 部 分 所 讨论 的 , 数值 应 用 往往 具有 很 大 的 并 行 性 。 特 别 地 , 它们 经 常 含有 
各 次 迭代 之 间 相 互 完全 独立 的 循环 。 从 并 行 化 的 角度 看 , 这 些 被 称 为 do-all 循环 的 循环 很 有 吸引 
力 , 原因 是 它们 的 迭代 可 以 并 行 执行 , 其 加 速 比 和 循环 的 迭代 数目 呈 线 性 关系 。 具 有 很 多 磷 代 的 
do-all 循环 具有 的 并 行 性 足以 充满 一 个 处 理 器 的 所 有 资源 。 能 否 充 分 利用 循环 中 的 可 用 并 行 性 完 
全 依赖 于 调度 器 的 能 力 。 本 节 描 述 一 个 被 称 为 软件 流水 线 化 (software pipelining) 的 算法 。 它 可 以 
同时 对 整个 循环 进行 调度 ,充分 利用 各 个 迭代 之 间 的 并 行 性 。 
10.5.1 引言 

在 本 节 中 ,我 们 将 使 用 例 10. 12 中 的 do-all 循环 来 解释 软件 流水 线 化 。 我 们 首先 说 明 跨 越 选 
代 的 调度 极其 重要 , 原因 是 在 单一 迭代 过 程 中 的 运算 之 间 的 并 行 性 相对 较 小 。 然 后 , 我 们 说 明 循 
环 展开 技术 通过 让 被 展开 迭代 相互 重合 执行 来 提高 程序 的 性 能 。 但 是 , 被 展开 循环 之 间 的 界限 
仍然 为 代码 移动 设置 了 障碍 , 还 有 很 多 可 改进 性 能 机 会 没有 被 循环 展开 技术 充分 利用 。 另 一 方 
面 , 软件 流水 线 化 技术 将 多 个 连续 的 迭代 持续 地 交 释 执行 , 直到 所 有 和 迭代 执行 完毕 为 止 。 这 个 技 
术 使 得 软件 流水 线 化 技术 可 以 生成 高 效 紧凑 的 代码 。 
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PORE 下 面 是 一 个 典型 的 do-all 循环 : 


for (i = 0; i < n; i++) 
DUi] = Afi]*Bfi] + c; 


LTTE AE TE LR RAAB Tia] BA AF a SG aes ST a HE BE 0 AS Td AE ty BR SEY 
位 置 。 因 此 各 个 迭代 之 间 没 有 内 存 依赖 关系 ， 所 有 的 迭代 都 可 以 并 行 地 进行 。 
在 本 节 中 , 我 们 选择 下 面 的 模型 作为 目标 机 器 。 在 这 个 模型 中 ， 
© 机 器 可 以 在 同一 个 时 钟 周期 内 发 出 : 一 个 加 载运 算 、 一 个 保存 运算 、 一 个 算术 运算 和 一 个 
分 支 运算 。 


© 机 器 有 一 个 如 下 形式 的 循环 回归 运算 指令 





BL R, L 
这 个 运算 把 寄存 器 R 的 值 减 一 , 并 且 在 结果 不 为 0 的 情况 下 跳 转 到 位 置 。 


o 内 存 运 算 有 -- 个 自动 加 一 的 寻 址 模式 ,通过 寄存 器 之 后 的 ++ 符号 表示 。 在 每 次 访问 之 
后 ,寄存 器 自动 地 加 --, 指向 接 下 来 的 一 个 地 址 。 
e 算术 运算 是 完全 流水 线 化 的 。 每 个 时 钟 周期 可 以 启动 一 个 算术 运算 , 但 是 结果 要 到 2 个 
时 钟 周期 后 才 可 用 。 所 有 其 他 指令 的 执行 延 时 为 一 个 时 钟 周期 。 
”如 果 每 次 只 对 一 个 迭代 进行 调度 ,那么 在 这 个 机 
器 模型 上 得 到 的 最 好 调度 方案 如 图 10-17 所 示 。 该 图 // RA, R2, R3 = KA, &B, &D 




















中 也 指明 了 一 些 有 关 数 据 布局 的 假设 ; 寄存 器 R1 .R2 二 

和 R3 存放 数组 4.B AD 的 开始 地 址 , 寄存 器 R4 存放 | | ， in as, omun 

常量 c， 而 寄存 器 R10 存放 值 n-1, 这 个 值 在 循环 之 LD R6, O(R2++) 

外 计算 。 这 个 计算 过 程 大 部 分 是 串 行 的 ， 共 需要 7 个 EE 

时 钟 周期 。 只 有 循环 回归 运算 指令 的 执行 和 和 迭代 的 最 ADD R8, R7, R4 

后 一 个 运算 的 执行 重 玖 。 O(R3++), R8 BL R10, L 





一 般 来 说 , RITT DLE IF — AER HY ROK 
获得 较 好 的 硬件 利用 率 。 但 是 这 么 做 会 增加 代码 的 大 图 10-17 #10. 12 的 局 部 调度 代码 
小 , 会 对 程序 的 整体 性 能 产生 负面 影响 。 因 此 , 我 们 必须 选择 一 个 折 圳 方案 , 选择 适当 的 迭代 展 
开 次 数 以 选择 最 大 的 性 能 提升 , 但 是 又 不 能 过 度 扩展 代码 。 下 面 的 例子 解释 了 这 种 折衷 方案 。 
虽然 在 例 10. 12 中 循环 的 各 个 迭代 内 部 几 











乎 找 不 到 并 行 性 , 但 各 个 选 代 之 间 依然 具有 很 多 并 行 “| to 

性 。 循 环 展开 技术 把 该 循环 的 多 个 迭代 放 到 一 个 大 基 iti FB 

本 块 中 , 然后 使 用 一 个 简单 的 列表 调度 算法 来 对 这 些 MUL LD 

运算 进行 调度 , 使 之 并 行 运行 。 如 果 把 我 们 的 例子 中 ae ae 

的 循环 展开 四 次 并 把 算法 10.7 应 用 于 展开 得 到 的 代 ST MUL LD 

码 , 那么 就 可 以 得 到 图 10-18 显示 的 调度 方案 (为 简单 ae i 

起 见 ， 我 们 忽略 寄存 器 分 配 的 细节 ) 。 这 个 循环 执行 了 PE 

13 个 时 钟 周 期 ,或 者 说 每 个 迭代 执行 3. 25 个 周期 。 st BL (L) 








一 个 被 天 次 展开 的 循环 至 少 需要 25 +5 HS AY 
期 ,得 到 的 吞 星 量 是 每 2 + Sk 个 时 钟 周期 一 个 迭代 。 图 10-18 例 10. 12 的 未 展开 的 代码 
因此 , 我 们 展开 的 迭代 越 多 , 循环 就 运行 得 越 快 。 当 有 ->% 时 , 一 个 完全 展开 的 循环 可 以 平均 每 
两 个 时 钟 周期 执行 一 次 迭代 。 但 是 , 我 们 展开 的 迭代 越 多 , 得 到 的 代码 也 越 大 。 我 们 当然 承担 不 
起 把 一 个 循环 的 全 部 和 迭代 都 展开 的 代价 。 把 这 个 循环 展开 4 次 生成 了 有 13 条 指令 的 代码 , 执行 
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时 间 是 最 优 情况 的 163% ; 把 这 个 循环 展开 8 次 生成 了 带 有 21 条 指令 的 代码 , 执行 时 间 是 最 优 情 


况 的 131% 。 反 过 来 , 如果 我 们 希望 执行 时 间 只 是 最 优 情况 的 110% , 我 们 需要 把 这 个 循环 展开 
25 Yk, 这 将 产生 带 有 55 条 指令 的 代码 。 口 





10. 5.2 ”循环 的 软件 流水 线 化 
软件 流水 线 化 提供 了 一 个 方便 的 优化 方法 ， 能够 在 优化 资源 使 用 的 同时 保持 代码 的 简洁 。 

让 我 们 用 一 个 连续 的 例子 来 说 明 这 个 想法 。 

U 图 10-19 中 显示 的 是 把 例 10. 12 展开 5 次 之 后 得 到 的 代码 (我 们 再 次 忽略 了 对 寄存 器 

使 用 方面 的 考虑 ) 。 第 i 行 中 显示 的 是 在 第 i 个 时 钟 周 

期 发 出 的 所 有 运算 指令 ; 第 j 列 中 显示 的 是 第 j 次 送 代 | 二， 17? 159 i54 das 

的 全 部 运算 。 请 注意 , 相对 于 各 个 迭代 的 开始 时 间 ， 2 LD 

















2 

每 个 迭代 都 有 同样 的 调度 方案 , 同时 要 注意 每 个 迭代 | bP 
都 在 前 一 个 选 代 开始 两 个 时 钟 周期 之 后 开始 。 可 见 ，| 5 MUL LD 
这 个 调度 方案 满足 所 有 的 资源 和 数据 依赖 约束 。 7 MUL LD 

我 们 看 到 , 在 第 7 和 第 8 个 时 钟 周期 运行 的 运算 | 9。 各 ar 
和 在 第 9 和 第 10 个 周期 运行 的 运算 是 一 样 的 。 第 7 10 ST ADD LD 
和 第 8 个 时 钟 周期 执行 的 运算 来 自 原 程序 中 的 前 四 | j se 
ER, 第 9 和 第 10 个 时 钟 周期 执行 的 运算 也 是 来 | 13 
HME, 不 过 这 次 是 来 自 第 2 到 第 5 THER. 实 。 s a 
RE, 我 们 可 以 不 停 地 执行 同样 的 多 运算 指令 对 ,不 | 16 st 





断 有 一 个 最 老 的 迭代 退出 ， 又 有 一 个 新 的 迭代 加 入 ， 
直到 运行 完 所 有 的 迭代 。 

如 果 假 设 这 个 循环 至 少 有 4 个 迭代 , 那么 这 样 的 
动态 行为 可 以 用 图 10.20 中 显示 的 代码 简洁 地 编码 。 
图 中 的 每 一 行 对 应 于 一 条 机 器 指令 。 第 7 行 和 第 8 
行 形成 了 一 个 两 个 时 钟 周期 的 循环 。 这 个 循环 将 执 
行 a-3 次 , 其 中 中 是 原 循环 中 的 迭代 次 数 。 =O 

上 面 描述 的 技术 被 称 为 软件 流水 线 化 技术 ， 因 
为 这 是 原本 用 于 硬件 流水 线 调度 的 技术 在 软件 中 的 
对 应 。 我 们 可 以 把 这 个 例子 中 各 个 迄 代 执行 的 调度 
方案 当 作 一 个 8 阶段 的 流水 线 。 每 两 个 时 钟 周期 就 
可 以 在 这 条 流水 线 上 启动 一 个 新 迭代 。 在 开始 的 时 
候 , 这 条 流水 线 中 只 有 一 个 迭代 在 运行 。 在 第 一 个 
选 代 进 行 到 第 三 阶段 的 时 候 ， 第 二 个 迭代 开始 进入 


图 10-19 例 10.12 经 过 5 次 迭代 
展开 后 得 到 的 代码 














图 10-20 例 10.12 的 经 软件 
Tr 一 个 4 A 
ORSTA i, 流水 线 化 的 代码 


到 第 7 个 时 钟 周期 时 , 流水 线 被 前 面 四 个 迭代 充 
满 。 在 稳定 状态 下 有 四 个 连续 的 迭代 同时 运行 。 每 
当 流 水 线 中 最 老 的 迭代 退出 时 就 有 一 个 新 的 迭代 被 启动 。 当 我 们 运行 完 所 有 的 迭代 时 , 流水 线 
开始 排 空 , 其 中 的 所 有 和 迭代 运行 结束 。 用 来 填充 流水 线 的 指令 序列 (在 这 个 例子 中 是 第 1 到 第 6 
行 ) 被 称 为 序言 (prolog) ; 第 7 和 第 8 行 被 称 为 稳定 状态 ( steady state) ; 用 来 排 空 流水 线 的 指令 序 


列 ( 即 第 9 行 到 第 14 行 ) 被 称 为 尾声 (epilog) o 
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对 于 这 个 例子 , 我 们 知道 这 个 循环 不 可 能 运行 得 比 每 两 个 时 钟 周期 一 个 迭代 更 快 。 原 因 是 
目标 机 器 每 个 时 钟 周期 只 能 发 出 一 个 读 指 令 , 而 每 个 迭代 有 两 个 读 指令 。 上 面 的 经 软件 流水 线 
化 的 循环 在 2n + 6 个 时 钟 周期 内 执行 完毕 , 其 中 是 原 循环 的 迭代 次 数 。 当 no 时 ,这 个 循环 
的 通 量 接近 每 两 个 时 钟 周期 一 次 迭代 。 因 此 ,和 循环 展开 技术 不 同 , 软件 调度 可 以 用 一 个 非常 简 
洁 的 代码 序列 给 出 最 优 调度 方案 的 编码 。 

请 注意 , 对 于 单个 迭代 而 言 , 这 个 调度 方案 的 运行 时 间 并 不 是 最 短 的 。 利 图 10-17 中 显示 的 
局 部 优化 的 调度 方案 相 比 ,这 个 方案 在 ADD 运算 之 前 引入 了 一 个 延 时 。 引 入 这 个 延 时 是 调度 策 
略 之 一 , 其 目的 是 使 这 个 调度 方案 可 以 在 保证 没有 资源 冲突 的 情况 下 每 两 个 时 钟 周期 启动 一 个 
迭代。 如 果 我 们 坚持 使 用 局 部 紧凑 的 调度 方案 , 为 了 避免 资源 冲突 , 各 次 启动 之 间 的 间隔 不 得 不 
延长 到 4 个 时 钟 周 期 ， 而 吞吐 率 将 被 减 半 。 这 个 例子 说 明了 流水 线 调度 的 一 个 重要 原则 ; 必须 小 
心 选择 调度 方案 以 便 优化 吞吐 量 。 虽然 一 个 局 部 紧凑 的 调度 方案 可 以 使 完成 一 个 迭代 的 时 间 降 
到 最 低 , 但 是 在 流水 线 化 之 后 得 到 的 吞吐 量 却 可 能 是 次 优 的 。 

10. 5.3 寄存 器 分 配 和 代码 生成 
我 们 首先 讨论 例 10. 14 中 经 过 软件 流水 线 化 的 循环 的 寄存 器 分 配 。 
WW 在 例 10.14 中 , 第 一 个 迭代 中 的 乘法 运算 结果 在 第 3 个 时 钟 周期 生成 , 在 第 6 个 时 
钟 周期 使 用 。 在 这 两 个 时 钟 周 期 之 间 , 第 二 次 迭 代 中 的 这 个 乘法 运算 又 在 第 5 个 时 钟 周期 生成 一 
个 新 的 结果 , 这 个 值 在 第 8 个 时 钟 周 期 使 用 。 这 两 次 迭代 的 结果 必须 保存 到 不 同 的 寄存 器 中 ， 以 
防止 它们 之 间 互 相干 扰 。 因 为 干扰 只 会 在 两 个 相 令 的 迭代 











之 间 发 生 , 使 用 两 个 寄存 器 就 可 以 避免 这 种 干扰 : 一 个 寄 | Td foor (C043) /2)， 
存 器 用 于 奇数 次 欠 代 , 另 一 个 寄存 器 用 于 偶数 次 迭代 。 因 “| else 
N2 = 0; 


为 奇数 次 迭代 的 代码 和 偶数 次 迭代 的 代码 不 同 , 稳定 状态 
循环 的 代码 大 小 是 原来 的 两 倍 。 这 个 代码 可 以 用 于 执行 任 
何 具 有 大 于 等 于 5 的 奇数 次 迭代 的 循环 。 

为 了 处 理 迭 代 次 数 小 于 5 的 循环 和 具有 偶数 次 迭代 的 


for (i = 0; i < N2; i++) 
D[i] = AfiJ* B[i] + c; 

for (i = N2; i < N; i++) 
D[i] = ACil* BLi] + c; 














循环 , 我 们 生成 的 代码 在 源 语言 层次 上 和 图 10-21 中 的 代 图 10-21 Bij 10.12 中 循环 在 源 
码 等 价 。 第 一 个 循环 被 流水 线 化 了 , 它 的 机 器 语言 层次 的 语言 层次 上 的 展开 
等 价 表示 见 图 10-22。 图 10-21 的 第 二 个 循环 不 需要 优化 ,因为 它 最 多 迭代 4 次 。 o 
1. LD R5,0(Ri++) 
2. LD R6,0(R2++) 
3. LD R5,0(Ri++) MUL R7,R5,R6 
4, LD R6,0(R2++) 
5. LD R5,0(Ri++) MUL R9,R5 ,R6 
6. LD R6,0(R2++) ADD R8,R7,R4 
Į: LD R5,0(Ri++) MUL R7,R5,R6 
8. LD R6,0(R2++) ADD R8,R9,R4 ST 0(R3++) ,R8 
9. LD R5,0(Ri++) MUL R9,R5,R6 
10. LD R6,0(R2++) ADD R8,R7,R4 ST O(R3++),R8 BL R10,L 
il. MUL R7,R5,R6 
12. ADD R8,R9,R4 ST 0(R3++) ,R8 
13. 
14. ADD R8,R7,R4 ST O(R3++) ,R8 
15. 
16. ST 0(R3++) ,R8 








图 10-22 ”在 例 10. 15 中 经 过 软件 流水 线 化 和 寄存 器 分 配 之 后 得 到 的 代码 
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10.5.4 Do-Across 循环 
BREE TK BS AL AR BT LAFF SR AR a EE HE RH FRY EA, ERA IE RK OW 
do-across 循环 。 





for (i = 0; i < n; i++) { 
sum = sum + Ali]; 
B[i] = Afi] * b; 

} 


的 两 个 连续 迭代 之 间 具 有 数据 依赖 关系 ,因为 前 一 次 的 sum (AA ALi) AAO ENA sum 值 。 如 
果 目 标 机 器 可 以 提供 足够 的 并 行 性 , 这 个 求 和 运算 可 以 在 Oog) 时 间 内 完成 。 但 是 为 了 本 次 讨 
论 , 我 们 假设 必须 遵守 所 有 的 顺序 依赖 关系 ， 上面 的 加 法 必须 以 原来 的 顺序 完成 。 因 为 我 们 假设 
的 机 器 模型 需要 两 个 时 钟 周期 才能 完成 一 个 ADD 运算 ,所 以 循环 的 运行 不 可 能 快 过 每 两 个 时 钟 
周期 一 个 迭代 。 给 该 机 器 增加 更 多 的 加 法 器 和 乘法 器 都 不 会 使 循环 运行 得 更 快 。 像 这 样 的 do- 
across 循环 的 吞吐 量 受 迭代 之 间 的 依赖 链 的 限制 。 

图 10-23a 显示 了 每 个 迭代 的 最 好 的 局 部 紧凑 的 调度 方案 , 经 过 软件 流水 线 化 处 理 的 代码 在 
图 10-23b 中 显示 。 这 个 软件 流水 线 化 的 循环 每 两 个 时 钟 启 动 一 次 迭代 , 因此 运行 的 速度 是 最 优 


























的 。 o 
// Ri = &A; R2 = &B 
— // R3 = sum 
// Ri = &A; R2 = BB // R4 = 
// R3 = sum // R10 = n-2 
// R4 = 日 
// R10 = n-1 LD R5, O(R1++) 
MUL R6, R5, R4 
L: LD R5, O(Ri++) L: ADD R3, R3, R4 LD R5, O(Ri++) 
MUL R6, R5, R4 ST R6, O(R2++) MUL R6, R5, R4 BL R10, L 
ADD R3, R3, R4 ADD R3, R3, R4 
ST R6, O(R2++) BL R10, L ST R6, O(R2++) 
= | 
a) 最 好 的 局 部 紧凑 的 调度 方案 b) 调度 方案 的 软件 流水 线 化 版 本 


图 10-23 一 个 do-across 循环 的 软件 流水 线 化 


10.5.5 软件 流水 线 化 的 目标 和 约束 

软件 流水 线 化 的 主要 目标 是 使 一 个 长 时 间 运 行 的 循环 的 吞吐 量 最 大 , 次 要 目标 之 一 是 使 生 
成 代码 保持 合理 的 大 小 。 换 句 话 说， 经 过 软件 流水 线 化 的 循环 应 该 有 一 个 较 小 的 流水 线 稳定 状 
态 。 我 们 可 以 要 求 每 个 迭代 的 相对 调度 方案 相同 , 并 要 求 各 个 迭代 启动 的 时 间 间 隔 相 同 ， 从 而 得 
到 一 个 较 小 的 稳定 状态 。 因 为 循环 的 甜 吐 量 是 启动 间隔 的 倒数 , 所 以 软件 流水 线 化 的 日 标 是 使 
这 个 间隔 最 小 化 。 

一 个 数据 依赖 图 C = (NE) 的 软件 流水 线 调度 方案 可 以 描述 为 

1) 一 个 启动 间隔 7。 

2) 一 个 相对 调度 方案 $S。 对 每 个 运算 ， 它 给 定 了 该 运算 相对 于 它 所 处 迭代 的 开始 时 刻 的 执 
行 时 间 。 

因此 , 如 果 从 0 开始 计算 时 钟 周期 的 话 , 第 i 个 迭代 的 一 个 运算 将 会 在 第 ixT+S(n) 个 时 
钟 周 期 上 运行 。 和 所 有 其 他 的 调度 问题 一 样 , 软件 流水 线 化 有 两 种 约束 : 资源 和 数据 依赖 关系 。 
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下 面 我 们 详细 讨论 每 一 种 约束 。 

模 数 资源 预约 

令 一 个 机 英 的 资源 表示 为 R=[r1,r;,…], 其 中 表示 第 i 种 资源 的 可 用 数目 。 如 果 一 个 循 
环 的 单 次 迭代 需要 nj 个 单元 的 第 i 种 资源 , 那么 一 条 流水 线 化 的 循环 的 平均 启动 间隔 至 少 是 
max;( ni/r;) 个 时 钟 周期 。 软 件 流水 线 化 要 求 在 任何 一 对 相 邻 迭代 之 间 的 启动 间隔 是 一 个 常量 值 。 
因此 , 它 的 启动 间隔 至 少 是 max, | n/r | 个 时 钟 周 期 。 如 果 max; (77;) 小 于 1, 那么 把 源 代码 少量 
AS la a 
让 我 们 回 到 图 10-20 所 示 的 经 过 软件 流水 线 化 处 理 的 循环 。 回 顾 -一 下 ， 目 标 机 器 可 
以 在 每 个 时 钟 膨 期 内 发 出 一 个 加 载 指令 、 一 个 算术 运算 指令 、 一 个 保存 指令 和 ee 
指令 。 央 为 这 个 循环 有 两 个 加 载运 算 、 两 个 算术 运算 和 一 个 保存 运算 ， 所 以 根据 资源 约束 ,这 个 
循环 的 最 小 启动 间隔 是 2 个 时 钟 周期 。 

图 10-24 显示 了 四 个 连续 迭代 在 不 同时 刻 的 资源 需求 。 随 着 被 启动 迭代 数量 的 增加 ,所 需 的 
资源 也 越 来 越 多 , 最 终 达到 稳定 状 
态 下 的 最 大 资源 需求 。 令 RT 为 表 <a 
FREAD UE RAR TE VE RA YEU | | 全 
Z, IED RT, 表示 循环 的 稳定 状态 
所 需要 的 资源 。RTs WER 了 个 
时 钟 周期 启动 的 四 个 相 邻 迭代 所 | 
需 的 资源 组 合 起 来 。RTs 表 的 第 0 mii 
行 所 需 的 资源 是 RT[0] .RT[2]、 | 
RT[4] 和 R7[6] 所 需 资 源 的 总 和 。 | 
类 似 地 ， 表 中 第 1 行 所 需 资源 对 应 
于 RT[1] .RT[3] .RT[5] 和 R7I7] | 
所 需 资 源 的 总 和 。 也 就 是 说 ,稳定 | 
状态 下 第 i 行 所 需 资源 可 以 由 下 面 j 
e [10-24 W] 10. 13 PAREO AEE R SERA 

RTS[i] = Š RT[i] 


[a (t mod 2) =i 
我 们 把 表示 稳定 状态 的 资源 预约 表 称 为 这 条 流水 线 化 的 循环 的 模 数 资源 预约 表 ( modular resource- 
reservation ) 。 

为 了 检查 软件 流水 线 调度 方案 是 否 存在 冲突 , 我 们 只 需要 检查 模 数 资源 预约 表 中 指出 的 资 
源 需求 。 如 果 在 稳定 状态 下 的 资源 需求 可 以 被 满足 , 那么 在 序言 和 尾声 中 , 即 在 稳定 状态 循环 之 
前 和 之 后 的 代码 部 分 中 , 资源 需求 也 一 定 可 以 被 满足 。 oO 

总 的 来 说 ,给 定 一 个 启动 间隔 了 和 单个 迭代 的 一 个 资源 预约 表 RT, 流水 线 化 的 调度 方案 在 
一 个 资源 向 量 为 的 机 器 上 没有 资源 冲突 ， 当 且 仅 当 RTS [i] <R Xfi =0,1,---, 7-1 都 成 立 。 

数据 依赖 约束 

在 软件 流水 线 化 中 的 数据 依赖 关系 和 我 们 至 今 为 目 直 到 的 依赖 关系 不 同 , 因为 它们 可 能 会 
形成 环 。 一 个 运算 可 能 会 依赖 于 前 一 个 迭代 中 同一 个 运算 的 结果 。 现 在 仅仅 在 依赖 边 上 加 上 一 
个 表示 延 时 的 标号 已 经 不 够 了 , 我 们 还 需要 区 分 同一 个 运算 在 不 同 迭 代 中 的 实例 。 如 果 在 第 i 次 
连 代 中 的 运算 ns 必须 在 第 i-6 次 迭代 中 的 运算 ni 执行 至 少 d 个 时 钟 之 后 才 可 以 执行 , 那么 我 们 
给 依赖 边 nn 加 上 标号 <5,d > 。 令 5 是 软件 流水 线 化 的 调度 方案 , 它 是 一 个 从 数据 依赖 图 中 
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的 结 点 到 整数 的 亢 数 ， 并 令 7 为 启动 时 间 间 隔 的 月 标 , 那么 
(EXT) +S(n,) -S(n,) Bd 
其 中 的 选 代 距 离 5 必须 是 非 负 的 。 而 且 , 给 定 一 个 由 数据 依赖 图 的 边 组 成 的 环 ， 至 少 一 个 边 具有 
正 的 迭代 距离 。 
AGE 考虑 下 面 的 循环 , 并 假设 我 们 不 知道 p H q 的 值 : 


for (i = 0; i < n; i++) 
*(p++) = *(qtt) + c; 


我 们 必须 假设 任何 一 对 "(p ++) A (g++ ) 都 可 能 访问 同一 个 内 存 位 置 。 因 此 ， 所 有 的 读 
和 写 运算 都 必须 按照 诛 来 的 串 行 | 顺序 进行 。 假 设 本 例 中 目标 机 器 a 
和 例 10. 12 中 描述 的 机 器 有 同样 的 特性 ,这 段 代码 的 数据 依赖 边 y Ree 
如 图 10-25 所 示 。 但 是 , 请 注意 我 们 忽略 了 循环 控制 指令 。 本 来 
应 该 有 这 条 指令 的 , 它 要 么 计算 并 测试 i 的 值 , 要 么 根据 Ri 或 
R2 的 值 来 完成 这 个 测试 。 ot od Se 


如 下 例 所 示 ， 两 个 相关 运算 之 间 的 迭代 距离 可 以 大 于 1: = 
l JST O(R2++}),R5 








LD R4,0(R1++) 








for (i = 2; i <n; i++) 
Ali] = Bli] + Ali-2]; 


在 第 i 个 迭代 中 写 人 的 值 在 两 个 迭代 之 后 才 会 被 用 到 。 央 此 
在 保存 4[ 引 的 运算 和 加 载 4[i-21] 的 依赖 边 之 间 的 迭代 距离 
是 2。 

一 个 循环 中 出 现 的 数据 依赖 环 还 对 循环 的 执行 吞吐 量 增 加 了 另 一 个 限制 。 比 如 , 图 10-25 中 
的 数据 依赖 环 限定 了 两 个 连续 大 代 中 的 加 载运 算 之 间 必 须 有 至 少 4 个 时 钟 周期 的 延 时 。 也 就 是 
说 , 循环 的 执行 不 可 能 快 过 每 4 个 时 钟 周期 一 次 迭代 。 

一 个 被 流水 线 化 的 循环 的 启动 间隔 不 小 于 


> aat] 


o | 
c 共 一 个 6 中 的 限 6 
2; effect & 











Æ 10-25 例 10.18 的 
数据 依赖 图 





个 时 钟 周期 。 

总 结 一 下 , 每 个 被 软件 流水 线 化 的 循环 的 启动 间隔 受到 每 个 迭代 的 资源 使 用 情况 限制 。 也 
就 是 说 , 对 于 每 一 类 资源 , 启动 间 喇 必须 不 小 于 一 次 迭代 所 需 该 类 资源 的 数目 除 以 机 器 上 该 类 资 
源 的 可 用 数量 所 得 的 商 。 另 外 , 如 果 循 环 中 存在 数据 依赖 环 , 那么 它 的 启动 间隔 还 必须 不 小 于 这 
个 环 中 的 延 时 总 数 除 以 环 中 选 代 距 离 之 和 得 到 的 商 。 这 些 量 的 最 大 值 定义 了 启动 间隔 的 下 界 。 
10. 5.6 一 个 软件 流水 线 化 算法 

软件 流水 线 化 的 目标 是 找到 一 个 具有 最 小 启动 间隔 的 调度 方案 。 这 个 问题 是 NP 完全 的 , 并 
且 可 以 被 写成 一 个 整数 线性 规划 问题 。 我 们 已 经 说 明 , 如果 知道 最 小 的 启动 间隔 , 那么 调度 算法 
可 以 在 放置 各 个 运算 时 使 用 模 数 资源 预约 表 来 避免 资源 冲突 。 但 是 只 有 当 我 们 找到 一 个 调度 方 
案 之 后 才能 知道 最 小 启动 间隔 是 什么 。 我 们 怎样 才能 解 开 这 样 的 循环 套 ? 

我 们 可 以 按照 上 面 讨论 的 方法 根据 循环 的 资源 需求 和 依赖 环 计 算得 到 启动 间隔 的 下 界 。 我 
们 已 知 启动 间隔 必须 大 于 这 个 下 界 。 如 果 我 们 可 以 找到 一 个 调度 方案 使 得 启动 间隔 就 是 这 个 下 
界 , 那么 就 找到 了 最 优 的 调度 方案 。 如 果 我 们 找 不 到 这 样 的 调度 方案 , 可 以 再 使 用 大 一 点 的 启动 
间隔 进行 尝试 , 直到 找到 一 个 符合 要 求 的 调度 方案 为 止 。 请 注意 , 如 果 使 用 启发 式 搜索 而 不 是 穷 
尽 搜索 , 那么 这 个 过 程 找 到 的 可 能 不 是 最 优 的 调度 方案 。 
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我 们 能 否 找到 接近 下 界 的 调度 方案 依赖 于 相应 数据 依赖 图 的 性 质 以 及 目标 机 的 体系 结构 。 
如 果 依赖 图 是 无 环 的 ， 并且 每 条 机 器 指令 只 需要 一 个 单元 的 某 种 资源 ,那么 我 们 可 以 很 容易 地 找 
到 最 优 的 调度 方案 。 如 果 可 用 的 硬件 资源 超过 了 有 环 的 依赖 图 所 需要 的 资源 , 那么 也 很 容易 找 
到 启动 间隔 接近 于 下 界 的 调度 方案 。 对 于 这 些 情况 ,建议 一 开始 就 把 下 界 作为 初始 的 启动 间隔 
目标 ， 然 后 逐渐 把 目标 增加 一 个 时 钟 周期 ， 并 且 每 增加 一 次 进行 一 次 调度 尝试 。 另 一 种 可 能 性 是 
使 用 二 分 搜索 法 来 寻找 启动 间隔 。 我 们 可 以 把 列表 调度 法 为 单 次 迭代 生成 的 调度 方案 的 长 度 作 
为 启动 间隔 的 上 界 。 
10.5.7 “对 无 环 数据 依赖 图 进行 调度 

为 简单 起 见 ， 我 们 现在 假设 即将 进行 软件 流水 线 化 处 理 的 循环 只 包含 一 个 基本 块 。 在 
10.5. 11 节 中 将 放宽 这 个 假设 条 件 。 
53% 10. 对 一 个 无 环 依赖 图 进行 软件 流水 线 化 处 理 。 

输入 : 一 个 机 器 资源 向 量 尺 = [rm ,mm ,…] , 其 中 x; 表示 第 i 种 资源 的 可 用 单元 数量 ; 一 个 数据 
依赖 图 C = (N,E)。N 中 的 每 个 运算 n 用 它 的 资源 预约 表 RT, 作为 标号 ; 已 中 的 每 条 边 e =n, ny 
上 有 标号 <6。,d, > 。 这 个 标号 表示 m 只 能 在 往 前 第 6, 个 迭代 中 的 结 Uy 横行 由 个 时 名 半期 之 
后 才 可 以 执行 。 

输出 : 一 个 经 过 软件 流水 线 化 的 调度 方案 S 和 一 个 启动 间隔 To 

Fk: 执行 图 10-26 中 的 程序 。 口 

算法 10. 19 将 无 环 的 数据 依赖 图 进行 软件 流水 线 化 处 理 。 这 个 算法 首先 基于 图 中 运算 的 资源 
需求 找到 启动 间隔 的 界限 Too 
然后 它 尝试 以 T 为 启动 间隔 的 | mand { 








Ty = max [ZETE], 
目标 , 寻找 一 个 软件 流水 线 化 Ne ee oe 
i 案 : b for (T = To, To + 1,... ,直到 和 中 的 所 有 结 点 都 已 经 被 调度 完毕 ) { 
的 调度 方案 。 如 果 算 法 不 能 为 fr Re eee mn 
当前 目标 找到 一 个 调度 方案 ， for (按照 带 优先 级 的 拓扑 顺序 访问 N 中 的 每 个 结 点 n ) { 
eps =i R a = E PEAN, d, 
它 就 不 断 增加 启动 间隔 并 重复 aE 
尝试 。 if (NodeScheduled(RT,T,n,s) break; 
f : if ( n 无 法 在 RT 中 调度 ) break; 
这 个 算法 在 每 次 尝试 中 使 a 
用 了 一 个 列表 调度 方法 。 它 使 } 


用 一 个 模 数 资源 预约 表 RT 来 跟 | } 


踪 流 水 线 的 稳定 状态 所 要 求 的 T T,n,s) { 
Ft = R . 


资源 。 运 算 按 照 拓 扑 顺 序 进 行 for (在 RT, 中 的 每 一 行 i ) 

` ‘AB a we 忆 六 RT'[(s + i) mod T] = RT'[(s + i) mod T] + RT, [A]; 
调度 ， 以 便 总 是 能 够 通过 推迟 if (对 于 所 有 i RTG) < R) { 

运算 来 满足 数据 依赖 关系 。 为 RT = RT’; 

了 调度 一 个 运算 , 它 首先 根据 nd 


return true; 
数据 依赖 约束 找到 一 个 下 界 s0。 } 

然后 , 它 调 用 NodeScheduled 来 else return false; 
检测 在 稳定 状态 上 可 能 发 生 的 一 一 一 一 一 一 一 
资源 冲突 。 如 果 发 现 了 资源 冲 图 10-26 无 环 依赖 图 的 软件 流水 线 化 算法 

R, 该 算法 试图 把 这 个 运算 安排 在 下 一 个 时 钟 周期 。 因 为 资源 冲突 检测 的 到 模特 性 ,如果 发 现 该 
运算 在 连续 了 个 时 钟 周期 上 都 有 冲突 , 那么 继续 尝试 也 不 会 有 用 。 此 时 , 这 个 算法 认为 对 当前 启 
动 间隔 目标 的 尝试 已 经 失败 , 继续 尝试 男 一 个 启动 间隔 。 
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把 各 个 运算 尽早 安排 的 启发 式 规则 往往 会 使 单个 近代 的 调度 方案 的 长 度 最 小 化 。 但 是 , 尽 
早 安排 一 条 指令 可 能 会 加 长 某 些 变 量 的 生命 期 。 比 如 ,加载 数据 的 运算 往往 会 被 较 早 安排 , 有 时 
候 会 在 数据 被 使 用 前 很 早 就 执行 。 处 理 这 个 问题 的 一 个 简单 的 启发 规则 是 逆向 地 调度 一 个 依赖 
图 , 理由 是 加 载运 算 通常 要 多 于 保存 运算 。 
10.5.8 ”对 有 环 数 据 依赖 图 进行 调度 
依赖 环 明显 地 增加 了 软件 流水 线 化 的 复杂 性 。 当 按照 拓扑 顺序 对 一 个 无 环 图 中 的 运算 进行 
调度 时 ,被 调度 的 运算 之 间 的 数据 依赖 关系 只 能 给 出 每 个 运算 位 置 的 下 界 。 结 果 , 算法 总 是 能 够 
通过 推迟 运算 来 满足 数据 依赖 关系 。 有 环 的 图 没有 “拓扑 排序 ”的 概念 。 实 际 上 , 给 定 一 个 环 中 
的 一 对 运算 , 放置 一 个 运算 会 限定 第 二 个 运算 的 位 置 的 下 界 和 上 界 。 
ny Al ny 是 一 个 依赖 环 中 的 两 个 运算 , S 是 一 个 软件 流水 线 调度 方案 , 而 了 是 这 个 调度 方 - 
案 的 启动 间隔 。 一 个 带 有 标号 <5, ,di > KRG nj on, 对 5(n1) 和 5S(ns) 加 上 了 如 下 约 东 : 
(8, xT) +S(n,) ~- S(n,) Bd, 
类 似 地 , 一 个 带 有 标号 < 5 ,ds > 的 依赖 边 ns 一 ni 增加 了 如 下 约束 : 
(6, XT) +S(n,) -S(n.) 2d, 





因此 
S(n,) +d, - (8; XT) <S(n.) <S(n,) - d, + (8, x T) 

一 个 图 的 强 连通 分 量 ( Strongly Connected Component , SCC) 是 满足 如 下 条 件 的 一 个 结 点 集合 ， 
其 中 的 每 个 结 点 都 可 以 从 集合 中 的 所 有 其 他 结 点 到 达 。 对 SCC 中 的 一 个 结 点 进行 调度 将 会 从 上 
下 两 个 方向 限制 其 他 各 个 结 点 的 可 行 时 间 。 如 果 存 在 一 个 从 nl 到 ny 的 路 径 p, 那么 有 

S(m) = S(m) = Ed = (8. x T) (10.1) 

请 注意 下 面 的 情况 : 

1) 沿 着 任何 一 个 环 , 各 个 边 上 的 5 值 的 总 和 必须 为 正 。 如 果 和 是 0 或 者 负数 , 就 表明 环 中 的 
一 个 运算 要 么 必须 在 它 自己 之 前 执行 , 要 么 所 有 迁 代 中 的 该 运算 都 在 同一 时 钟 周期 执行 。 

2) 一 个 迭代 中 的 各 运算 的 调度 方案 和 所 有 和 迭代 中 的 调度 方案 相同 , 这 个 要 求实 质 上 就 是 
“软件 流水 线 " 的 含义 。 结 果 , 一 个 环 上 的 延 时 ( 即 数据 依赖 图 中 边 的 标号 的 第 二 个 元 素 ) 的 总 和 
除 以 环 上 的 迭代 距离 的 总 和 所 得 的 商 就 是 启动 间隔 了 的 一 个 下 界 。 

当 我 们 把 这 两 点 联系 起 来 , 就 可 以 看 到 ,如果 是 一 个 环 , 那么 对 于 任何 可 行 的 启动 间隔 了 ， 
式 (10.1) 的 右边 部 分 的 值 必然 是 负数 或 零 。 由 此 可 见 ,， 对 于 结 点 位 置 的 最 强 约 束 来 自 于 简单 路 
径 一 一 那些 不 包含 环 的 路 径 。 

因此 , 对 于 每 个 可 行 的 启动 间隔 了, 计算 每 对 结 点 之 间 的 数据 依赖 关系 的 传递 效果 就 等 同 于 
寻找 从 第 一 个 结 点 到 达 第 二 个 结 点 的 最 长 的 简单 路 径 。 不 仅 如 此 , 因为 环 不 会 增加 一 条 路 径 的 
KÆ, 所 以 可 以 用 一 个 简单 的 动态 规划 算法 在 没有 “简单 路 
径 "需求 的 情况 下 来 寻找 最 长 路 径 。 这 样 得 到 的 长 度 也 一 定 
是 最 长 简单 路 径 的 长 度 ( 见 练习 10. 5.7)。 

图 10-27 PR TANDA abcd 的 数据 依 
赖 图 。 每 个 结 点 上 附加 了 该 结 点 的 资源 预约 表 , 每 条 边 上 
附加 了 它 的 迭代 距离 和 延 时 。 假 设 这 个 例子 中 的 目标 机 器 





























用 , 而 第 二 种 资源 有 两 处 使 用 ,所 以 启动 间隔 必须 不 小 于 3 acd me oe 
个 时 钟 。 在 这 个 图 中 有 两 个 连通 分 量 : 第 一 个 是 只 包含 了 依赖 图 和 资源 需求 
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结 点 a 的 分 基 , 第 二 个 包含 了 结 点 5.c 和 d。 最 长 的 环 0 的 总 延 时 是 3 个 时 钟 周 期 。 这 
个 环 把 相隔 一 个 近代 的 结 点 连接 起 来 。 因 此 , 根据 数据 依赖 环 约束 得 到 的 启动 间隔 的 下 界 也 
是 3 个 时 钟 周期 。 

对 5.c 或 d 中 的 任何 一 个 进行 调度 都 会 对 分 景 中 的 其 他 结 点 产生 约 东 。 令 7 为 启动 间隔 。 图 
10-28 显示 了 传递 依赖 关系 。 几 10-28a 显示 






























































了 每 条 边 的 延 时 和 先 代 距离 5。 其 中 的 延 时 FT 
是 直接 表示 的 , 而 8 则 是 通过 在 廷 时 上 “加 ” ， i de ee 
上 -67 来 表示 的 。 ee ae 

如 果 两 个 结 点 之 间 存 在 简单 路 径 , WA LE (LORE 
图 10-28b 中 就 显示 了 这 两 个 结 点 之 间 的 最 长 a) 原 图 的 边 日 最 长 简单 路 径 
简单 路 径 的 长 度 。 表 中 的 项 是 图 10-28a 中 给 S SS 
出 的 路 径 上 各 条 边 的 表达 式 的 和 。 然 后 , Ep an IA 
图 10-280 和 图 10-284 中 ,我们 看 到 的 表达 式 | Jal lı ef tat | 
是 将 图 10-28b 的 表达 式 中 的 了 替换 为 两 个 相 “ [| 2- a | | 
关 值 ( 即 3 和 4) 之 后 得 到 的 表达 式 。 根 据 不 VARRET) d) 最 长 简单 路 径 (7=4) 
同 的 了 值 , 两 个 结 点 m 和 m 的 调度 时 间 位 图 10-28 4] 10.20 中 的 传递 约束 





BZ Sn) -SC ) 必须 不 小 于 在 图 10-28c 
或 图 10-28d 中 的 项 (m na) 的 值 。 

比如 , 考虑 图 10-28 中 给 出 的 表示 从 “到 “的 最 长 (简单 ) 路径 的 项 2-7。 从 到 2 的 最 长 简 
单 路 径 是 "一 dp。 这 条 路 径 上 的 总 延 时 是 2, 而 5 的 和 是 1, 它 表 明和 迭代 编号 必须 加 1。 因 为 了 
表示 每 个 迭代 和 前 一 个 迭代 的 时 间 差 异 , 为 5 安排 的 时 钟 周期 必须 至 少 是 安排 给 c 的 时 钟 周期 之 
后 的 第 2 -了 个 时 钟 半 期 。 因 为 了 至 少 是 3, 我 们 实际 上 是 说 5 必须 被 安排 在 c 之 前 的 了 -2 个 时 
钟 周期 或 再 晚 一 些 , 但 是 不 能 更 早 了 。 

请 注意 , 考虑 从 到》 的 非 简 单 路 径 并 不 会 产生 更 强 的 约束 。 我 们 可 以 在 路 径 cd) 上 加 
上 由 d 和 65 组 成 的 环 的 任意 多 次 达 代 。 如 果 我 们 加 上 个 这 样 的 环 , 因为 路 径 的 总 延 时 为 3， 而 
环 上 的 8 的 总 和 是 1, 我 们 得 到 的 路 径 长 度 为 2-7 了 +k(3 -7 了 )。 因 为 了 =>3,， 所 以 这 个 长 度 绝 不 会 
超过 2 -了 , Bb 的 时 钟 和 < 的 时 钟 的 差 的 下 界 是 2 - 了, 也 就 是 我 们 考虑 最 长 简单 路 径 时 得 到 的 
界限 。 

比如 ,从 项 (45,c) 和 (c,d) 我 们 可 以 知道 

S(e) - S(b) 21 
S(b) - S(c) B2-T, 
也 就 是 说 ， 
S(b) +1 < S(c) < S(b) -2+T 
如 果 了 =3 ，, 则 
S(b) +1 < S(c) < S(b) 41 
等 价 地 说 ,c 必须 被 安排 在 5 后 一 个 时 钟 周 期 上 。 但 是 , MR T=, 
S(b) +1 < S(c) < S(b) +2 

也 就 是 说 ,ec TY A BRECHEEE b JG — a ST A E o 

给 定 所 有 点 对 之 间 的 最 长 路 径 的 信息 , 我 们 可 以 很 容易 地 计算 出 由 于 数据 依赖 的 原因 ,一 个 
结 点 可 以 放置 在 什么 位 置 。 我 们 看 到 , 当 7=3 时 放置 结 点 2 的 位 置 是 没有 松弛 度 的 , 而 当 7 增 
加 的 时 候 这 个 松弛 度 会 增加 。 
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455% 10.21 软件 流水 线 化 。 
输入 : 一 个 机 器 资源 向 量 R= [r,r], 其 中 表示 第 i 种 资源 的 可 用 单元 的 数量 ; 一 个 数 

据 依赖 图 CG = (N,E)。W 中 的 每 个 运算 n 的 标号 为 它 的 资源 预约 表 RT, ; E PHAY e =n >n 

上 有 标号 <6。,d。 > ， 这 个 标号 表示 m 的 执行 时 刻 不 能 时 于 向 前 第 5, THEIR PER 由 之 后 的 

d, 个 时 钟 周期 。 

输出 : 一 个 软件 流水 线 化 的 调度 方案 S 和 一 个 启动 间隔 To 

方法 : 执行 图 10-29 中 的 程序 。 口 











main() { 
E = {ele in E, ô: = = 0}; 
max 


RT, (i de 
To = max | max ae BP, e2) [že ince 
2 c acycleinG zð 


for (T= TT t1... 或 者 直到 G 中 的 所 有 SCC 知名 被 调度 完毕 ){ 
RT = 一 个 全 行 的 空 资源 预约 表 ; 
E* = AllPairsLongestPath(G,T); 
for ( 以 带 优先 级 的 拓扑 顺序 遍历 G 中 的 每 个 SCC C ) { 
for (对 C 中 的 备 个) 
so(n) = MadXe=pon in FB,p scheduled (S(p) + de): 
first = 基 个 使 得 s6(n) 取 最 小 值 的 n :; 
so = so(first); 
for (s = so0;s<sot+7T;s=s+1) 
if (SccScheduled (RT,T,C, first, s)) break; 
if (C 不 能 在 RT 中 调度 ) break; 





} 
} 
} 
SccScheduled( RT, T, c, first, s) { 
RT' = RT; 
if (not NodeScheduled (RT",T, first, s)) return false; 
for (按照 E' 中 备 条 边 的 带 优先 级 的 拓扑 排序 
访问 c 中 余下 的 每 个 nn) { 
Sp = MaXe=n' >n in E*n’ in en! scheduted (S(n') +d. 一 (ĝe x T)); 
Su = MiNesnsn! in E*n’ in en scheduted (S (720) = de (de x T)); 
for (s = sjs< min(su si +T- 1); s=5s+1) 
if ( NodeScheduled(RT', T, n, s)) break; 
if ( n RREME RT’ 中 调度 ) return false; 
} 
RT = RT’; 
return true; 
} 











图 10-29 ”一 个 针对 有 环 依赖 图 的 软件 流水 线 化 算法 


算法 10. 21 在 高 层 结构 上 和 和 只 能 处 理 无 环 图 的 算法 10. 19 类 似 。 在 本 算法 处 理 的 情况 中 , 最 
小 的 启动 间隔 不 仅 受到 资源 需求 的 限制 ， 也 受到 图 中 数据 依赖 环 的 限制 。 整个 图 是 按照 每 次 处 
理 一 个 强 连 通 分 量 的 方式 进行 调度 的 。 通 过 把 每 个 强 连 通 分 量 当 作 一 个 单元 , 在 强 连通 分 量 之 
间 的 边 必 然 形 成 一 个 无 环 图 。 算 法 10. 19 的 顶层 循环 按照 拓扑 | 顺序 来 调度 图 中 的 结 点 , 而 算法 
10. 21 的 顶层 循环 按照 拓扑 顺序 调度 各 个 强 连通 分 量 。 和 前 面 一 样 ,如果 算 法 不 能 调度 所 有 的 分 
E, 那么 它 就 会 尝试 较 大 的 启动 间隔 。 请 注意 , 如 果 给 定 一 个 无 环 的 数据 依赖 图 , 算法 10. 21 和 
算法 10. 19 的 做 法 是 完全 一 样 的 。 

算法 10. 21 要 计算 得 到 额外 两 个 边 集 : 忍 是 所 有 的 选 代 距 离 为 0 的 边 , 而 * 是 所 有 点 对 之 
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间 的 最 长 路 径 边 集 。 也 就 是 说 , 对 每 个 结 点 对 (p,n) ,只 要 有 一 条 从 p 到 nn 的 路 径 , 在 互 * 中 就 有 
一 条 边 。， 该 边 所 关联 的 长 度 d, 是 从 p 到 的 最 长 简单 路 径 的 长 度 。 对 于 启动 间隔 目标 7 的 每 -- 
个 取 值 都 需要 计算 相应 的 E”。 也 可 以 像 我 们 在 练习 10. 20 中 所 做 的 那样 ， 先 使 用 了 的 符号 化 值 
一 次 性 完成 这 个 计算 过 程 , 然后 在 每 一 次 迭代 的 时 候 把 7 替换 为 实际 的 启动 间 隐 的 值 。 

算法 10.21 使 用 了 回 湖 。 如 果 它 不 能 完成 一 个 SCC 的 调度 , 它 就 会 延 后 一 个 时 钟 周 期 再 次 
对 整个 SCC 进行 调度 。 这 些 调度 尝试 会 持续 7 了 个 时 钟 周期 。 回 溯 是 很 重要 的 , 因为 如 例 10. 20 
所 示 ,， 对 于 一 个 SCC 中 的 第 一 个 结 点 的 调度 安排 可 能 会 完全 地 决定 所 有 其 他 结 点 的 调度 安排 。 
如 果 这 个 调度 方案 不 能 和 至 今 已 经 产生 的 调度 方案 配合 , 那么 这 次 尝试 就 失败 了 。 

在 对 一 个 SCC 进行 调度 时 , 对 该 分 量 中 的 每 个 结 点 ， 此 算法 确定 了 满足 已 * 中 的 传递 数据 依 
赖 关系 的 最 早 可 调度 的 时 间 。 然 后 , 算法 选择 具有 最 时 开始 时 间 的 结 点 作为 第 一 个 被 调度 的 结 
点 。 然 后 , 此 算法 调用 SccScheduled, 试图 根据 这 个 最 早 开 始 时 间 实 际 调度 这 个 分 量 。 如 果 尝 试 
失败 , 此 算法 将 逐次 增 大 开始 时 间 , 不 断 尝 试 。 该 算法 最 多 做 7 次 尝试 。 如 果 了 次 尝试 失败 了 ， 
该 算法 就 会 尝试 另 一 个 启动 间隔 。 | 

算法 SccScheduled 和 算法 10. 19 类 似 , 但 是 有 三 大 不 同 之 处 : 

1) SccScheduled 的 目标 是 对 输 和 人 的 强 连通 分 量 在 给 定时 间 位 置 * 上 进行 调度 。 如 果 该 强 连 通 
分 量 的 第 一 个 结 点 不 能 被 安排 在 * 上 ，SccScheduled 就 返回 false, WEEN, ERR main 可 以 使 
用 一 个 较 晚 的 时 间 位 置 再 次 调用 SecScheduled。 

2) 在 强 连通 分 量 中 的 结 点 按照 ”中 的 边 集 所 确定 的 拓扑 顺序 进行 调度 。 因 为 E' 中 的 所 有 
边 的 迭代 上 距离 都 是 0, 这 些 边 不 会 穿越 任何 迭代 边界 , 也 就 不 会 形成 环 ( 穿越 迭代 边界 的 边 被 称 






























































为 穿越 循环 的 ) 。 只 有 穿越 循环 的 依赖 会 设置 指令 可 调度 位 置 的 上 界 。 因 此 ,这 个 调度 顺序 以 及 
尽早 调度 安排 各 条 指令 的 策略 把 后 继 结 点 的 可 调度 范围 最 大 化 了 。 

3) 对 于 强 连通 分 量 , 依赖 关 | feel pie ome ee 
系 既 给 出 了 一 个 结 点 的 可 调度 范 尝试 启动 间隔 | 结 点 | 区 间 | 调度 安排 预约 天 
围 的 下 界 ,又 给 出 了 其 上 界 。 | Al ega 
SceScheduled 计算 了 这 些 范 围 ， 并 e | (3,3) = 
使 用 它们 进一步 限制 调度 尝试 。 al eee he Sa ae 
RRA 让 我 们 把 算法 10.21 Gee Te 
应 用 到 例 10. 20 中 的 有 环 的 数据 a | te] | 0 
依赖 图 上 。 算 法 首先 计算 出 这 个 | 3 | Tes | ?| 人 和 | 5 
例子 的 启动 间隔 的 下 界 是 3 个 时 AR OAS 
钟 周期 。 注 意 , 这 个 下 界 不 可 能 DE ae 
达到 。 当 启动 间隔 7 是 3 时 ,图 | 4 | TF f ej eaj 3 
10-28 中 的 传递 依赖 关系 决定 了 [ee 
S(d) = S(b) =2。 把 结 点 4 和 4 安 | ， | |b leoa] 3 
排 在 间隔 两 个 时 钟 的 位 置 会 在 长 IE aE 
度 为 3 的 模 数 资源 预约 表 中 产生 a a a 
一 个 冲突 。 6 | T=4 : 2 > ; 

图 10-30 说 明了 算法 10. 21 是 d | (6,7) he 6 
如 何 处 理 这 个 例子 的 。 它 首先 试 





图 找到 一 个 启动 间隔 为 3 个 时 钟 人 
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周期 的 调度 方案 。 这 次 尝试 开始 时 , 算法 尽 可 能 早 地 调度 结 点 a Alb, 但 是 , 一 旦 结 点 了 被 安排 
在 第 二 个 时 钟 周期 , 结 点 “ 就 只 能 安排 在 第 3 个 时 钟 周期 。 这 和 结 点 a 的 资源 使 用 相 冲 突 。 也 就 
是 说 , a 和 < 在 能 够 被 3 整除 的 时 钟 周 期 上 都 需要 第 一 种 资源 。 

这 个 算法 执行 回溯 ,试图 延 后 一 个 时 钟 周期 再 对 强 连 通 分 量 15,c,d| 进行 调度 。 这 一 次 结 点 
b 被 安排 在 第 三 个 时 钟 赔 期 上 ,而 结 点 < 可 以 被 成 功 地 安排 在 第 4 个 时 钟 周期 上 。 但 是 , 结 点 d 
不 能 被 安排 在 第 5 个 时 钟 周期 上 。 也 就 是 说 , 在 能 够 被 3 整除 的 时 钟 周 期 上 ,5 和 了 都 需要 第 二 
种 资源 。 请 注意 ,虽然 至 今 为 止 找到 的 两 个 冲突 都 发 生 在 除 以 3 的 余数 都 是 0 的 时 钟 位 置 上 , 但 
是 这 只 是 一 个 巧合 ; 在 其 他 的 例子 中 , 冲突 可 能 在 余数 为 1 或 2 的 时 钟 周 期 上 发 生 。 

算法 再 次 延 后 一 个 时 钟 周 期 党 试 对 强 连 通 分 量 {o,c,d| 进行 调度 。 但 是 , 前面 讨论 过 ， 当 启 
动 间隔 是 3 个 时 钟 周期 时 , 这 个 强 连通 分 景 实际 上 永远 不 可 能 被 成 功 地 调度 , 因此 这 次 尝试 一 定 
会 失败 。 此 时 , 这 个 算法 放弃 尝试 , 并 试图 找到 一 个 启动 间隔 为 4 个 时 钟 的 调度 方案 。 这 个 算法 
最 终 在 第 6 次 尝试 时 找到 了 最 优 调度 方案 。 
10. 5.9 对 流水 线 化 算法 的 改进 : 

算法 10. 21 是 一 个 相当 简单 的 算法 , 尽管 人 们 发 现 它 能 够 在 实际 的 目标 机 器 上 很 好 地 完成 任 
务 。 这 个 算法 中 的 要 素 包 括 : 

1) 使 用 一 个 模 数 资源 预约 表 来 检查 稳定 状态 下 的 资源 冲突 。 

2) 需要 计算 传递 依赖 关系 ,以便 在 出 现 依赖 环 的 时 候 找到 各 个 结 点 可 以 被 调度 的 合法 范围 。 

3) 回溯 是 有 用 的 ,而 关键 环 ( 即 给 出 了 启动 间隔 了 的 最 高 下 界 的 环 ) 上 的 结 点 都 必须 一 起 重 
新 调度 ,因为 它们 之 间 的 时 间 间 隔 是 没有 松弛 度 的 。 

有 很 多 种 方法 可 以 改进 算法 10.21。 比 如 ,这 个 算法 花 了 一 段 时 间 才 发 现 对 于 简单 的 例子 
10. 22 来 说 , 采用 3 个 时 钟 的 启动 间隔 是 不 可 行 的 。 我 们 可 以 首先 对 各 个 强 连 通 分 量 进行 独立 调 
度 , 确定 当前 的 启动 间隔 对 于 各 个 分 量 是 否 可 行 。 

我 们 也 可 以 改变 结 点 被 调度 的 顺序 。 算 法 10. 21 中 使 用 的 顺序 有 一 些 不 利之 处 。 第 一 , 因为 
JEF FLAY SCC 难以 调度 , 所 以 首先 对 它们 进行 调度 是 较 好 的 选择 。 第 二 , 有 些 寄存 器 的 生命 期 可 
能 不 需要 那么 长 。 因 此 期 望 能 够 使 定 值 位 置 靠近 使 用 位 置 。 可 行 方法 之 一 是 首先 调度 带 有 关键 
环 的 强 连通 分 量 , 然后 向 两 端 扩展 调度 方案 。 

10. 5. 10” 模 数 变量 扩展 

如 果 一 个 标量 变量 的 活 牙 范围 处 于 循环 的 一 个 迭代 之 内 , 那么 该 标量 变量 被 称 为 可 私有 化 
的 (privatizable ) 。 换 句 话说, 一 个 可 私有 化 变量 不 能 在 任何 人 迁 代 的 入 口 或 者 出 口 处 活跃 。 这 些 变 
量 会 这 样 命名 的 原因 是 执行 一 个 循环 中 的 不 同和 迭代 的 各 个 处 理 器 可 以 拥有 这 些 变量 的 私有 拷贝 ， 
使 得 它们 不 会 互相 干扰 。 

变量 扩展 (variahle expansion) 指 的 是 这 样 一 种 变换 技术 ; 它 把 一 个 可 私有 化 的 标量 变量 转换 
成 为 一 个 数组 ， 并 让 循环 的 第 :个 迭代 读 写 第 ; 个 元 素 。 这 个 转换 消除 了 一 个 迭代 中 的 读 和 运算 和 
后 一 个 迭代 中 的 写 运 算 之 间 的 反 依 赖 关 系 , 以 及 不 同 迭 代 的 写 运算 之 间 的 输出 依赖 关系 。 如 果 
所 有 的 穿越 循环 的 依赖 关系 都 可 以 被 消除 , 那么 循环 的 各 个 迭代 就 可 以 并 行 执行 。 

消除 穿越 循环 的 依赖 关系 也 就 消除 了 数据 依赖 图 中 的 环 , 这 样 可 以 大 大 提高 软件 流水 线 化 
的 效率 。 如 例 10. 15 所 示 , 我 们 不 需要 根据 循环 的 迭代 次 数 来 完全 扩展 可 私有 化 变量 。 同 一 时 间 
内 只 能 执行 少量 的 选 代 , 而 在 同一 时 刻 私有 变量 在 其 中 活 唉 的 迭代 数量 更 少 。 因 此 , 同一 个 内 存 
位 置 可 用 于 存放 其 生命 周期 不 交融 的 多 个 变量 的 值 。 更 明确 地 讲 ， 如 果 一 个 寄存 器 的 生命 周期 


是 ! 个 时 钟 ， 且 启动 问 隔 是 7, 那么 在 一 个 时 间 点 上 只 有 9 = | 地 | 个 值 是 活 中 的。 我 们 可 以 为 访 























| 存在 不 同 于 启发 式 的 方法 吗 ? 

我 们 可 以 把 同时 寻找 最 优 软 件 流水 线 调度 方案 和 寄存 器 分 配方 案 的 问题 写成 一 个 整数 线 
性 规划 问题 。 虽 然 很 多 整数 线性 规划 问题 可 以 很 快 地 得 出 解 , 但 有 些 问题 需要 特别 长 的 时 
间 。 在 编译 器 中 使 用 一 个 求解 整数 线性 规划 问题 的 程序 时 , 我 们 必须 能 够 在 它 无 法 在 某 个 预 
设 时 间 内 究 成 解答 时 退出 求解 过 程 。 

这 个 方法 曾经 在 一 个 目标 机 器 上 (SGI R8000) 实 验 性 地 尝试 过 , 结果 发 现 规划 求解 器 可 
以 在 一 个 合理 的 时 间 内 为 大 部 分 试验 程序 找到 最 优 解决 方案 。 我 们 发 现 , 用 局 发 式 方法 得 到 
的 调度 方案 和 最 优 解 相当 接近 。 这 个 结果 说 明 ， 至 少 对 于 那个 目标 机 器 , 使 用 整数 线性 规划 
方法 是 没有 什么 意义 的 。 从 一 个 软件 工程 师 的 角度 来 看 尤其 如 此 。 因 为 整数 线性 规划 求解 程 
序 可 能 不 会 按时 结束 , 在 编译 器 中 实现 某 种 启发 式 调度 程序 仍然 是 必要 的 。 一 旦 有 了 一 个 这 
样 的 启发 式 调 度 器 ,也 就 不 需要 再 去 实现 一 个 基于 整数 规划 技术 的 调度 器 了 。 














EE 个 用 术 数 变量 扩展 技术 的 软件 流水 线 化 。 
输入 : 一 -个 数据 依赖 图 和 一 个 机 器 资源 描述 。 
输出 : 两 个 循环 ,一 个 经 过 软件 流水 线 化 处 理 , 另 一 个 没有 。 


方法 : 
1) 从 输入 的 数据 依赖 图 中 删除 和 可 私有 化 变量 相关 的 穿越 循环 的 反 依赖 关系 和 输出 依赖 
关系 。 


2) 使 用 算法 10. 21 对 第 一 步 得 到 的 数据 依赖 图 进行 软件 流水 线 化 。 令 了 是 已 经 找到 相应 调 
度 方案 的 启动 间隔 ,了 是 一 个 选 代 的 调度 方案 的 长 度 。 
3) 对 于 每 个 可 私有 化 变量 "， 依据 得 到 的 调度 方案 计算 9, ， 即 ， 所 需要 的 最 小 寄存 器 数目 。 





令 Q =maxugvo 
4) 生成 两 个 循环 : 一 个 经 过 软件 流水 线 化 的 循环 和 一 个 没有 被 流水 线 化 的 循环 。 被 软件 流 
水 线 化 的 循环 有 
L 
Faas 


MERWE, 各 个 拷贝 之 间 相 距 了 个 时 钟 。 它 有 一 个 带 有 


L 
(zlar 
条 指令 的 序言 部 分 , 一 个 带 有 OT 条 指令 的 稳定 状态 和 一 个 具有 LT 条 指令 的 尾声 部 分 。 捅 人 一 
个 从 稳定 状态 的 尾部 到 稳定 状态 顶端 的 循环 回归 指令 。 
分 配给 可 私有 化 变量 的 寄存 器 数 日 是 
| gy 如 果 Qmodg, =0 
a ae 否则 
在 第 i 个 迭代 中 的 变量 v 使 用 的 是 被 分 配给 2 的 第 (i mod gq') 个 寄存 器 。 
S n 为 源 代 码 循环 中 表示 迭代 数目 的 变量 。 这 个 软件 流水 线 化 的 循环 被 执行 的 前 提 是 


L 
"> | pleo-1 
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循环 回归 分 支 的 执行 次 数 是 


ny = 


ae 
Q 





因此 , 软件 流水 线 化 的 循环 所 执行 的 源 代码 中 的 迭代 的 次 数 是 
l L L 
T a ugnal 对 |+ 0-1 


0 否则 


未 被 流水 线 化 的 循环 执行 的 迭代 数目 是 na = -no 





的 循环 有 7 个 迭代 的 拷贝 , 其 中 的 序言 、 稳 定 状 态 和 尾声 部 分 分 别 有 6 4.6 条 指令 。 令 n 为 源 代 
码 循环 中 的 和 欠 代 次 数 。 这 个 软件 流水 线 化 的 循环 在 ">5 的 时 候 被 执行 , 在 这 种 情况 下 循环 回归 
分 支 被 执行 
a 
2 


次 , 且 软 件 流水 线 化 的 循环 负责 执行 





个 源 代 码 循环 中 的 迭代 。 口 

模 数 扩展 会 把 稳定 阶段 代码 的 大 小 增加 到 O fF. BAUE, 由 算法 10. 23 生成 的 代码 仍然 
是 相当 精简 的 。 在 最 坏 情况 下 , 经 过 软件 流水 线 化 的 循环 的 指令 数目 是 单个 迭代 的 调度 方案 中 
指令 数目 的 三 倍 。 粗 略 地 讲 , 把 用 来 处 理 等 星 迭 代 的 额外 循环 加 在 一 起 , 整个 代码 的 大 小 大 约 是 
原 代码 大 小 的 四 倍 。 这 个 技术 通常 应 用 于 紧凑 的 内 层 循环 ， 因 此 这 样 的 代码 增加 量 是 可 接受 的 。 

算法 10. 23 可 以 使 用 更 多 的 寄存 器 来 使 代码 的 扩展 量 降 到 最 低 。 我 们 可 以 通过 生成 更 多 的 
代码 来 降低 对 寄存 器 的 使 用 。 如 果 我 们 使 用 一 个 具有 

TxLCM,gq, 
条 指令 的 稳定 状态 , 我 们 最 少 可 以 为 每 个 变量 wv 使 用 q, 个 寄存 器 。 这 里 , LCM, 是 求解 所 有 q, 的 
最 小 公 倍数 ( 即 能 够 被 所 有 q, 整除 的 最 小 整数 ) 的 函数 ," 的 取 值 范围 是 所 有 的 可 私有 化 变量 。 
遗憾 的 是 , 即使 对 少量 很 小 的 g, 值 , 最 小 公 倍 数 也 可 能 变 得 相当 大 。 
10. 5. 11 条 件 语句 

如 果 可 以 使 用 带 断 言 的 指令 , 我 们 可 以 把 控制 依赖 的 指令 转换 成 为 带 断 言 的 指令 。 带 断言 
的 指令 可 以 和 其 他 指令 一 样 进 行 软件 流水 线 化 处 理 。 但 是 ,如 果 在 循环 体内 有 很 多 依赖 于 数据 
的 控制 流 , 那么 就 更 加 适合 使 用 10. 4 节 中 的 算法 进行 调度 。 

如 果 一 个 机 器 没有 带 断 言 的 指令 , 那么 可 以 使 用 下 面 描述 的 层次 结构 归 约 (hierarchical re- 
duction) 技术 来 处 理 少量 的 依赖 于 数据 的 控制 流 。 和 算法 10. 11 类 似 , 在 层次 结构 归 约 中 , 对 一 
个 循环 控制 结构 的 调度 是 从 典 套 在 最 内 层 的 结构 开始 ,以 从 内 到 外 的 顺序 进行 调度 的 。 当 每 个 
结构 被 调度 时 ,整个 结构 被 归 约 为 一 个 结 点 。 这 个 结 点 代表 了 它 的 所 有 组 成 部 分 和 程序 的 其 他 
部 分 之 间 的 调度 约束 。 然 后 , 这 个 结 点 可 以 当 作 它 外 围 的 控制 结构 中 的 单个 结 点 进行 调度 。 当 
整个 程序 被 归 约 为 单个 结 点 的 时 候 , 调度 过 程 就 结束 了 。 
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当 处 理 一 个 带 有 "then" 分支 和 "else" 分 支 的 条 件 语句 时 , 我 们 首先 独立 地 对 各 个 分 支 进行 调 
度 。 然 后 : 

1) 整个 条 件 语句 的 约束 被 保守 地 设 定 为 来 自 两 个 分 支 的 约束 的 并 集 。 

2) 它 的 资源 使 用 情况 是 各 个 分 支 所 用 资源 的 最 大 值 。 

3) 它 的 先后 次 序 约束 是 各 个 分 支 中 此 类 约束 的 并 集 。 通 过 假设 两 个 分 支 都 被 执行 就 可 以 求 
得 这 个 约束 集合 。 

然后 , 这 个 结 点 就 可 以 和 其 他 结 点 一 样 进行 调度 。 需 要 生成 分 别 对 应 于 两 个 分 支 的 两 组 代 
码 。 任 何 被 安排 与 这 个 条 件 语句 并 行 执行 的 代码 都 需要 在 这 两 个 分 支 中 分 别 进行 复制 。 如 果 多 
A SpE AACE, 那么 对 并 行 执行 的 每 个 分 支 组 合 都 要 生成 单独 的 代码 。 
10. 5. 12 ”软件 流水 线 化 的 硬件 支持 

人 们 提出 了 特殊 的 硬件 支持 机 制 来 使 软件 流水 线 代码 的 大 小 降 到 最 低 。 在 Itanium 体系 结构 
中 的 轮转 寄存 器 文件 (rotating register file) 就 是 这 样 的 一 个 例子 。 轮 转 寄存 器 文件 有 一 个 基 寄 存 
器 (base register) , 可 以 把 基 寄 存 器 中 的 内 容 加 到 代码 中 给 定 的 寄存 器 编号 来 得 到 实际 被 访问 的 
寄存 器 。 我 们 只 需要 在 每 个 迭代 的 边界 上 改变 基 寄 存 器 中 的 内 容 , 就 可 以 让 一 个 循环 中 的 不 同 
迭代 使 用 不 同 的 寄存 器 。Itanium 体系 结构 也 支持 广泛 的 带 断 言 指 令 。 断 言 不 仅 可 以 把 控制 依赖 
转换 成 数据 依赖 , 它 也 可 以 用 来 避免 生成 序言 代码 和 尾声 代码 。 一 个 软件 流水 线 化 的 循环 体 中 
包含 了 所 有 在 序言 和 尾声 中 的 指令 。 我 们 只 需要 为 稳定 状态 生成 代码 , 并 适当 地 使 用 断言 来 抑 
制 多 余 的 运算 , 使 得 代码 的 运行 效果 就 像 是 存在 一 个 序言 和 一 个 尾声 。 

虽然 Itanium 的 硬件 支持 机 制 提高 了 经 软件 流水 线 化 的 代码 的 密度 , 我 们 必须 知道 这 种 支持 
机 制 可 不 便宜 。 因 为 软件 流水 线 化 技术 主要 用 于 最 内 层 循环 , 被 流水 线 化 处 理 的 循环 往往 很 小 。 
FWE, 对 于 那些 预期 会 用 于 执行 很 多 软件 流水 线 化 的 循环 且 尽 可 能 降低 代码 大 小 又 很 重要 的 
机 器 , 为 软件 流水 线 化 提供 专门 的 支持 机 制 是 合理 的 。 
10.5.13 10.5 节 的 练习 

练习 10. 5. 1: 在 例 10. 20 F, 我 们 说 明了 如 何 求 出 8 和 < 之 间 的 相对 时 钟 距离 的 上 下 界 。 分 
别 @ 为 一 般 化 的 T, OW T=3, OW T=4, 计算 另外 五 对 结 点 的 上 下 界 。 

练习 10. 5.2: 图 10-31 显示 的 是 一 个 循环 的 循环 体 。a(R9 ) 这 样 的 地 址 是 内 存 位 置 , 其 中 a 
是 一 个 常数 , 而 RO 是 对 该 循环 的 迭代 进行 计数 的 寄存 器 。 因 为 对 
于 不 同 的 迭代 有 不 同 的 R 的 值 , 所 以 可 以 假设 该 循环 的 每 个 迭代 | DLP EP RL, aao 





2) ST b(R9), Ri 
访问 不 同 的 位 置 。 使 用 例 10. 12 中 的 机 器 模型 , 按照 下 面 的 方法 对 | 3) LD R2, c(R9) 
图 1031 ANE J 

1) 尽量 保持 各 个 迭代 紧 致 ( 即 在 每 个 算术 运算 之 后 只 引入 一 | 6) SUB R4, Ri, R2 


7) ST b(R9), R4 


个 nop 运算 ) , 把 该 循环 展开 两 次 。 该 机 器 在 任意 时 钟 周 期 上 只 能 | 8) ERI L 
做 一 次 加 载运 算 、 一 个 保存 运算 、 一 个 算术 运算 以 及 一 个 分 支 运 
算 。 在 不 破坏 上 面 约束 的 情况 下 , 调度 第 二 次 迭代 使 之 在 尽 可 能 早 ”图 1031 练习 10.5.2 的 











的 时 刻 开 始 。 机 器 代码 
2) 重复 (1) 部 分 , 但 是 把 这 个 循环 展开 三 次 。 同 样 , 在 遵守 机 器 资 源 约束 的 情况 下 让 各 个 迭 
代 尽 可 能 早 地 启动 。 


13) 在 遵守 机 器 约束 的 情况 下 构造 完全 流水 线 化 的 代码 。 在 这 一 部 分 ,可 以 在 必要 时 引信 
nop 运算 ,但 是 你 必须 每 两 个 时 钟 周期 启动 一 个 新 迭代 。 
练习 10. 5. 3: 某 一 个 循环 需要 5 个 加 载运 算 、7 个 保存 运算 和 8 个 算术 运算 。 假 设 有 这 样 一 
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台 机 器 , 它 的 每 个 运算 都 能 够 在 一 个 时 钟 周期 内 完成 , 并 且 有 足够 的 资源 在 -一 个 时 钟 周 期 内 
执行 : 

1) 3 个 加 载运 算 , 4 个 保存 运算 和 5 个 算术 运算 。 

2) 3 个 加 载运 算 , 3 个 保存 运算 和 3 个 算术 运算 。 

请 问 对 于 上 面 的 两 种 情况 ,这 个 循环 经 软件 流水 线 化 后 的 启动 间隔 最 小 是 多 少 ? 

! 练习 10. 5.4: 使 用 例 10. 12 中 的 机 器 模型 ,为 下 列 循环 

for (i = 1; i < n; i++) { 

ALi] = B[i-1] + 1; 


B[i] = ACi-1] + 2; 
} 


寻找 最 小 的 启动 间隔 以 及 对 此 循环 的 各 个 迭代 的 统一 调度 方案 。 请 记 住 , 对 迭代 的 计数 是 通过 
寄存 器 的 自动 增 一 运算 实现 的 , 不 需要 专门 的 对 for 循环 计数 的 运算 指令 。 

! 练习 10. 5. 5: 请 证 明 , 如 果 每 个 运算 都 只 需要 一 个 单元 的 某 种 资源 , 算法 10. 19 总 能 够 找 
到 一 个 使 用 启动 间隔 下 界 的 软件 流水 线 调度 方案 。 

! 练习 10.5.6: 假设 有 一 个 结 点 集合 为 cc d 的 有 环 的 数据 依赖 图 。 从 a Elb ARA c E 
d 都 有 标号 为 (0, 1) 的 边 ; 从 5 到 c 及 从 a 到 a 都 有 标号 为 (1,1) 的 边 。 此 外 , 再 没有 其 他 的 边 。 

1) 画 出 这 个 有 环 的 依赖 图 。 

2) 计算 记录 了 结 点 之 间 的 最 长 简单 路 径 的 表 。 

3) 如 果 启 动 间隔 了 的 值 为 2, 指出 最 长 简单 路 径 的 长 度 。 

4) 设 T=3, 重复 (3)。 

5) 对 于 了 =3 的 情况 , EE ab cd 所 表示 的 各 条 指令 时 ,它们 之 间 的 相对 时 间 的 约束 是 
什么 ? 

| 练习 10.5.7: 假设 在 一 个 有 个 结 点 的 图 中 没有 长 度 为 正 的 环 , 给 出 一 个 O(n?) 的 寻找 
该 图 中 最 长 简单 路 径 长 度 的 算法 。 提 示 : 修正 Floyd 的 最 短路 径 算法 ( 见 A. V. Aho 和 
J. D. Ullman, Foundations of Computer Science, Computer Science Press, New York, 1992), 

1! 练习 10.5.8: 假设 我 们 有 一 个 带 有 三 种 指令 类 型 的 机 器 , 我 们 把 这 三 种 指令 称 作 4 .了 和 
C。 所 有 的 指令 都 需要 一 个 时 钟 周 期 ,并且 该 机 器 可 以 在 每 个 时 钟 周 期 执行 每 个 类 型 的 各 一 条 指 
令 。 假 设 一 个 循环 由 六 条 指令 组 成 , 每 种 两 个 , 那么 一 个 软件 流水 线 能 够 以 2 作为 启动 间隔 执行 
这 个 循环 式 。 但 是 ,这 六 条 指令 的 某 些 序列 要 求 插 和 人 一 个 延 时 ， 而 另外 一 些 序列 需要 插 人 两 个 延 
时 。 在 90 种 可 能 的 由 两 个 4 型 指令 、 两 个 8 型 指令 和 两 个 C 型 指令 组 成 的 序列 中 ,多少 个 序列 
不 需要 延 时 ? 多 少 个 序列 需要 一 个 延 时 ? 提示 : 在 这 三 类 指令 中 存在 对 称 性 , 因此 如 果 两 个 序列 
能 够 通过 交换 4 BA C 的 名 字 相 互 转换 , 那么 它们 就 需要 同样 多 的 延 时 。 比 如 , ABBCAC 一 定 和 
BCCABA 一 样 。 


10.6 第 10 章 总 结 


o 体系 结构 问题 : 被 优化 的 代码 调度 利用 了 现代 计算 机 体系 结构 的 一 些 特性 。 这 样 的 机 器 
常常 允许 以 流水 线 方式 执行 代码 ， 也 就 是 多 条 指令 在 同一 个 时 刻 处 于 不 同 的 执行 阶段 。 
有 些 机 器 还 允许 多 条 指令 在 同一 个 时 刻 开 始 执行 。 

o 数据 依赖 : 在 调度 运算 指令 时 , 我 们 必须 知道 这 些 指令 对 于 每 个 内 存 位置 和 寄存 器 的 影 
响 。 如 果 一 条 指令 必须 在 男 一 指令 对 某 个 内 存 位 置 写 人 之 后 才 读 取 该 位 置 的 值 , 那么 这 
两 条 指令 之 间 具 有 真 依赖 关系 。 如 果 有 一 个 对 同一 位 置 的 读 指令 之 后 的 写 指令 , 那么 两 
条 指令 之 间 就 出 现 反 依 赖 关系 ; 当 有 两 个 对 同一 位 置 的 写 指 令 时 就 会 出 现 输出 依赖 。 


指 今 级 并 行 性 485 





© 消除 依赖 关系 : 通过 使 用 附加 的 位 置 存放 数据 , 可 以 消除 反 依 赖 和 输出 依赖 。 只 有 真 依 

赖 不 能 被 消除 ,并 且 在 调度 代码 时 必须 保证 遵守 这 类 依赖 关系 。 

基本 块 的 数据 依赖 图 : 这 些 图 表示 了 一 个 基本 块 中 的 语句 之 闻 的 时 间 安 排 约 束 。 图 的 结 

点 对 应 于 这 些 语句 。 从 n 到 m 的 标号 为 d 的 边 表明 指令 m 的 开始 时 刻 必须 比 n 的 开始 时 

AMED d 个 时 钟 周期 。 

带 优 先 级 的 拓扑 排序 : 一 个 基本 块 的 数据 依赖 图 总 是 无 环 的 , 通常 有 很 多 个 与 这 个 依赖 

图 一 致 的 拓扑 排序 。 为 一 个 给 定 依赖 图 选择 较 好 的 拓扑 排序 的 启发 式 规 则 之 一 是 首先 选 

择 具 有 最 长 关键 路 径 的 结 点 。 

© 列表 调度 : 给 定 一 个 数据 依赖 图 的 带 优先 级 的 拓扑 排序 , 我 们 可 以 按照 这 个 顺序 考虑 对 
结 点 的 调度 。 在 对 每 个 结 点 进行 调度 时 , 把 每 个 结 点 安排 在 最 早 的 满足 下 列 条 件 的 时 钟 
周期 上 : 满足 图 的 边 所 蕴涵 的 时 间 安 排 约 束 , 并 且 和 所 有 之 前 已 经 调度 好 的 结 点 的 调度 
方案 一 致 , 同时 满足 该 机 器 的 资源 约束 。 














® 


本 块 的 前 驱 或 后 继 。 进 行 这 种 移动 的 好 处 在 于 有 机 会 在 新 的 位 置 上 并 行 执行 新 指令 ， 而 
在 床位 置 上 可 能 没有 这 个 机 会 。 如 果 原 基本 块 和 新 位 置 之 间 没有 支配 关系 , 那么 有 必要 
在 某 些 路 径 上 揪 和 补偿 代码 ， 以 保证 不 管控 制 流 如 何 运 行 , 被 执行 的 总 是 相同 的 代码 
序列 。 

do-all 循环 ; 一 个 do-all 循环 的 迭代 之 间 不 存在 依赖 关系 ,因此 各 个 迭代 都 可 以 并 行 运行 。 
do-all 循环 的 软件 流水 线 化 : 软件 流水 线 化 技术 充分 利用 了 目标 机 器 能 够 同时 执行 多 条 指 
令 的 能 力 。 通 过 调度 使 得 循环 的 各 个 迭代 的 开始 时 刻 只 相隔 很 短 的 时 间 。 在 此 过 程 中 可 
AG Fs SEER (CK PSA no-op 指令 以 避免 迁 代 之 间 产 生机 器 资源 冲突 。 结 果 , 循环 可 以 很 
快 地 执行 ,其 中 包括 序言 、 尾 声 和 (通常 ) 较 小 的 内 部 循环 。 

do-across 循环 : 很 多 循环 具有 从 每 个 迭代 到 后 续 迭 代 的 依赖 关系 。 这 些 循环 称 为 do- 
across 循环 。 

do-across 循环 的 数据 依赖 图 ; 为 了 表示 一 个 do-across 循环 的 指令 之 间 的 依赖 关系 , 依赖 
图 中 的 边 的 标号 由 两 个 值 组 成 : 必须 的 延 时 (和 表示 基本 块 的 依赖 图 中 的 延 时 含义 相同 ) 
以 及 在 具有 依赖 关系 的 两 条 指令 之 间 相 隔 的 迭代 数量 。 

循环 的 列表 调度 算法 : 为 了 调度 一 个 循环 ,我们 必须 为 所 有 的 迭代 选择 同一 个 调度 方案 ， 
并 选择 启动 间隔 ， 即 连续 迭代 的 启动 时 刻 的 间隔 。 这 个 算法 还 需要 获取 针对 循环 中 不 同 
省 令 的 相对 调度 方案 的 约束 。 它 通过 计算 两 个 结 点 之 间 的 最 长 无 环 路 径 的 长 度 来 获得 这 
种 约束 。 算 法 求 得 的 这 些 长 度 把 启动 间隔 作为 参数 ,因此 给 启动 间隔 设 定 了 一 个 下 界 。 


10.7 第 10 章 参 考 文 献 


如 果 希 望 对 处 理 器 体系 结构 和 设计 进行 更 深入 的 研究 , 我 们 推荐 Hennessy 和 Patterson[5] 。 

数据 依赖 的 概念 首先 出 现在 Kuch, Muraoka 和 Chen[6] 以 及 Lamport[8] 中 , 在 多 处 理 器 和 向 
量 机 编译 代码 的 上 下 文中 讨论 。 

指令 调度 首先 在 水 平 微 代码 调度 中 使 用 ([2, 3, 11 和 12]) 。Fisher 在 微 代码 压缩 上 的 研究 
成 果 使 他 提出 了 VLIW 机 器 的 概念 。 在 这 种 机 器 上 , 编译 器 可 以 直接 控制 运算 的 并 行 执行 [3 ]。 
Gross 和 Hennessy[ 4] 在 第 一 个 MIPS RISC 指令 集中 使 用 指令 调度 方法 来 处 理 被 延 时 的 分 支 。 本 
章 的 算法 是 基于 Bernstein 和 Rodeh[ 匡 的 研究 成 果 的 。 他 们 的 工作 对 具有 指令 级 并 行 机 制 的 机 器 
的 运算 调度 作出 了 更 一 般 化 的 处 理 。 - 
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第 11 章 ”并行 性 和 局 部 性 优化 


本 章 将 介绍 一 个 编译 器 如 何 增强 处 理 数组 的 计算 密集 型 程序 中 的 并 行 性 和 局 部 性 ,以 便 提 
高 目标 程序 在 多 处 理 器 系统 上 的 远 行 速度 。 很 多 科学 工程 和 商业 领域 的 应 用 对 计算 能 力 的 要 求 
是 永 无 下 境 的 。 这 些 例子 包括 气象 预报 , 用 于 药物 设计 的 蛋白 质 折合 , 用 于 设计 航空 推进 系统 的 
流体 动力 学 和 用 于 高 能 物理 中 强 相 互 作用 研究 的 量子 色 动力 学 。 

加 快 计算 过 程 的 方法 之 一 就 是 使 用 并 行 技 术 。 遗 憾 的 是 , 开发 可 以 利用 并 行 机 器 的 软件 并 
不 是 容易 的 事情 。 把 计算 过 程 分 割 为 多 个 可 以 在 不 同 并 行 处 理 器 上 执行 的 单元 已 经 是 很 困难 的 
事情 了 , 但 是 这 样 的 分 割 还 不 一 定 能 保证 提高 速度 。 我 们 还 必须 把 处 理 器 之 间 的 通信 量 减 到 最 
小 , 因为 通信 开销 很 容易 使 并 行 代码 运行 得 甚至 比 串 行 代码 还 慢 ! 

尽 可 能 降低 通信 开销 可 以 被 当 作 是 提高 程序 的 数据 局 部 性 (data locality) 的 一 个 特殊 情况 。 
一 般 来 说 , 如 果 一 个 处 理 器 经 常 访问 它 最 近 使 用 的 同一 组 数据 , 我 们 就 说 这 个 程序 具有 良好 的 数 
据 局 部 性 。 如 果 并 行 机 上 的 一 个 处 理 器 具有 良好 的 局 部 性 ， 它 就 不 需要 和 其 他 处 理 器 频繁 通信 。 
因此 , 并 行 性 和 数据 局 部 性 必须 放 在 一 起 考虑 。 数 据 局 部 性 本 身 对 于 单个 处 理 器 的 性 能 也 是 很 
重要 的 。 现 代 处 理 器 的 内 存 层次 结构 中 都 有 一 层 或 多 层 高 速 缓存 ,， 一 次 内 存 访问 可 能 会 需要 几 
十 个 机 器 周期 ， 而 在 高 速 缓存 中 命中 的 运算 只 需要 几 个 机 器 周期 。 如 果 一 个 程序 没有 良好 的 数 
FARE, 并 经 常 在 缓存 访问 中 脱 高, 那么 它 的 性 能 就 会 受到 影响 。 

在 本 章 中 同时 处 理 并 行 性 和 数据 局 部 性 的 另 一 个 理由 是 它们 使 用 的 理论 相同 。 如 果 我 们 知 
道 如 何 优化 数据 局 部 性 , 也 就 知道 了 并 行 性 在 哪里 。 在 本 章 , 你 将 看 到 第 9 章 中 为 进行 数据 流 分 
析 而 使 用 的 程序 模型 对 并 行 化 和 局 部 性 优化 来 说 是 不 够 的 。 原 因 是 在 数据 流 分 析 中 的 工作 假设 
我 们 不 需要 区 分 到 达 一 个 给 定语 名 的 不 同 路 径 。 实 际 上 , 第 9 章 中 的 那些 技术 利用 了 不 需要 区 分 
同一 个 语句 的 (例如 , 在 循环 中 的 ) 不 同 执行 的 事实 。 为 了 实现 代码 并 行 化 ,需要 考虑 同一 语句 
的 不 同 动态 执行 实例 之 间 的 依赖 关系 ， 以 决定 它们 是 否 可 以 在 不 同 处 理 器 上 同时 执行 。 

本 章 关注 的 是 用 于 优化 某 一 类 数值 应 用 的 技术 。 这 类 应 用 使 用 数组 作为 数据 结构 ， 并且 以 
一 种 简单 且 规 则 的 模式 访问 这 些 数据 结构 。 更 明确 地 说 , 我 们 研究 的 程序 中 包含 的 数组 访问 与 
外 围 循环 的 下 标 变量 之 间 具 有 仿 射 关 系 。 例 如 , Mi My 是 外 围 循环 的 下 标 变量 , 那么 Z[ 计 [让 
和 2[ 让 [i+ 门 都 是 仿 射 访问 。 如 果 关 于 一 个 或 多 个 变量 x ws、… ww 的 函数 可 以 被 表示 为 一 个 常 
数 加 上 常数 乘 以 这 些 变量 的 和 ， 即 Co 十 C1X1 十 C2X2 + + Cn Nn, 其 中 Co, Cys C23 “9 Cp 是 常数 ， 那 
么 这 个 函数 就 是 仿 射 的 。 仿 射 函 数 通 常 称 为 线性 函数 ,虽然 严格 地 讲 线性 函数 不 能 有 co 项 。 

下 面 是 这 个 领域 内 的 循环 的 一 个 简单 的 例子 : 


for (i = 0; i < 10; i++) { 
Z[i] = 0; 


} 
因为 这 个 循环 的 各 个 迭代 对 不 同 的 内 存 位 置 进行 写 运算 , 不 同 的 处 理 器 可 以 并 发 地 执行 不 同 的 
ER. AAW, 如 果 有 另 一 个 语句 Z[j] =1 正在 执行 , 我 们 就 要 担心 i 是否 可 能 和 j 相同 , 以 及 
如 果 相 同 的 话 , 要 按照 什么 顺序 来 执行 这 两 个 具有 相同 数组 下 标 值 的 语句 的 实例 。 

知道 哪些 迭代 可 能 指向 同一 个 内 存 位 置 是 很 重要 的 。 这 个 知识 使 我 们 可 以 描述 调度 代码 时 
必须 遵守 的 数据 依赖 , 不 管 被 调度 的 代码 是 在 单 处 理 器 上 运行 还 是 在 多 处 理 器 上 运行 。 我 们 的 
目标 是 找到 一 个 遵守 所 有 数据 依赖 关系 的 调度 方案 , 使 得 访问 相同 内 存 位 置 或 高 速 缓存 线 的 运 
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算 尽 可 能 靠近 执行 ; 并 且 在 多 处 理 器 的 情况 下 , 把 这 些 代 码 放 在 同一 个 处 理 器 上 执行 。 

本 章 中 给 出 的 理论 是 基于 线性 代数 和 整数 规划 技术 的 。 我 们 把 一 个 深度 为 n MERRE 
构 中 的 迭代 建 模 为 一 个 n 维 多 面 体 。 该 多 面体 的 边界 用 代码 中 循环 的 界限 来 描述 。 仿 射 函 数 把 
每 个 迭代 映射 成 为 它 所 访问 的 数组 位 置 。 我 们 可 以 使 用 整数 线性 规划 技术 来 确定 是 否 存在 可 能 
指向 同一 个 位 置 的 两 个 迭代 。 

我 们 在 这 里 讨论 的 代码 转换 方法 的 集合 可 以 分 成 两 类 : 仿 射 分 划 (affine partitioning) 和 分 块 
(blocking) 。 仿 射 分 划 把 迁 代 的 多 面体 分 割 成 为 多 个 部 分 , 在 不 同 的 机 器 上 执行 备 个 部 分 , 或 者 
一 个 一 个 地 顺序 执行 各 个 部 分 。 另 一 方面 ,分 块 技术 创建 了 一 个 由 迭代 组 成 的 层次 结构 。 假 设 
有 一 个 以 逐 行 方式 扫描 整个 数组 的 循环 。 我 们 可 以 把 这 个 数组 分 成 多 个 块 , 并 且 逐 块 访问 其 中 
的 元 素 。 最 后 得 到 的 代码 由 遍历 这 些 块 的 外 层 循环 和 扫描 各 块 中 元 素 的 内 层 循 环 组 成 。 线 性 代 
数 技术 用 来 确定 最 好 的 仿 射 分 划 和 最 好 的 分 块 方案 。 

在 接 下 来 的 内 容 中 , 我 们 先 在 11. 1 节 中 概述 关于 并 行 计算 和 局 部 性 优化 的 概念 。 然 后 ,在 
11.2 节 中 给 出 一 个 具体 例子 一 一 矩阵 乘法 。 这 个 例子 用 于 说 明 循环 转换 ， 即 对 一 个 循环 内 的 计 
算 过 程 进行 重新 排序 , 是 如 何 既 提高 局 部 性 又 提高 并 行 化 效率 的 。 

11.3 节 到 11.6 节 给 出 了 循环 转换 所 必需 的 基本 信息 。11.3 节 介 绍 如 何 对 一 个 循环 拒 套 结 
构 中 的 各 个 迭代 进行 建 模 ; 11.4 介绍 如 何 对 数组 下 标 函 数 建 模 。 这 类 函数 把 每 个 循环 迭代 上 映射 
到 被 该 选 代 访 问 的 数组 位 置 ; 11. 5 节 介 绍 如 何 使 用 标准 线性 代数 算法 来 确定 一 个 循环 中 的 哪些 
迭代 访问 了 相同 的 数组 位 置 或 高 速 缓存 线 ; 11.6 节 说 明 如 何 找到 一 个 程序 中 的 数组 引用 之 间 的 
所 有 数据 依赖 关系 。 

本 章 的 其 余部 分 应 用 这 些 基本 技术 来 进行 优化 。11.7 节 首 先 考虑 一 个 比较 篇 单 的 问题 ， 即 
寻找 不 需要 同步 的 并 行 性 。 为 了 找到 最 佳 的 仿 射 分 划 方 案 , 我 们 只 需要 找到 满足 下 面 约束 的 解 : 
具有 数据 依赖 关系 的 运算 必须 被 分 配 到 同一 个 处 理 器 上 。 

当然 , 没有 多 少 程序 能 够 在 不 需要 任何 同步 的 情况 下 实现 并 行 化 。 因 此 , 在 11.8 节 到 
11.9.9 节 将 探讨 寻找 需要 同步 的 并 行 性 的 一 般 情 况 。 我 们 引入 了 流水 线 化 的 概念 , 说 明 如 何 寻 
找 能 够 达到 一 个 程序 所 允许 的 最 大 流水 线 化 程度 的 仿 射 分 划 。 我 们 将 在 11. 10 节 中 说 明 如 何 优 
化 数据 局 部 性 。 最 后 , 我 们 讨论 如 何 把 仿 射 变换 用 于 其 他 形式 的 并 行 性 。 


11.1 基本 概念 


本 节 介 绍 了 一 些 和 并 行 化 及 局 部 性 优化 相关 的 基本 概念 。 如 果 运 算 可 以 并 行 执行 , 它们 也 
可 以 为 了 其 他 目的 (比如 局 部 性 ) 而 重新 排序 。 反 过 来 , 如 果 一 个 程序 中 的 数据 依赖 关系 决定 了 
一 个 程序 中 的 指令 必须 串 行 执行 ,这 个 程序 显然 不 具有 并 行 性 , 同时 也 没有 任何 机 会 对 指令 重新 
排序 以 提高 数据 局 部 性 。 因 此 , 并 行 化 分 析 也 可 以 寻找 可 用 的 机 会 , 为 了 提高 数据 局 部 性 而 进行 
移动 代码 。 

为 了 尽 可 能 降低 并 行 代码 之 间 的 通信 量 , 我 们 把 所 有 相关 的 运算 都 组 合 在 一 起 , 并 把 它们 分 
配给 同一 个 处 理 器 。 因 此 得 到 的 代码 必然 具有 数据 局 部 性 。 在 单 处 理 器 上 获得 良好 数据 局 部 性 
的 一 个 粗略 的 方法 是 让 该 处 理 器 顺序 执行 在 并 行 化 时 分 配给 各 个 处 理 器 的 代码 。 

在 本 节 中 , 我们 首先 概述 并 行 计算 机 体系 结构 。 然 后 给 出 并 行 化 的 基本 概念 。 并 行 化 是 一 
种 可 以 引起 巨大 变化 的 转换 技术 ; 同时 会 介绍 一 些 对 并 行 化 有 用 的 概念 。 然 后 我 们 讨论 了 如 何 
把 这 些 类 似 的 考虑 用 于 优化 数据 局 部 性 。 最 后 , 我 们 将 非 正式 地 介绍 本 章 中 使 用 到 的 数学 概念 。 
11.1.1 多 处 理 器 

最 流行 的 并 行 机 体系 结构 是 对 称 多 处 理 器 ( Symmetrie MultiProcessor, SMP) 结构 。 高 性 能 个 


并 行 性 和 局 部 性 优化 
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人 计算 机 通常 有 两 个 处 理 器 ,而 很 多 服务 器 有 由 个 八 个 ,其 至 几 十 个 处 理 器 。 不 仅 如 此 ,因为 现 


在 已 经 能 够 实现 把 多 个 高 性 能 处 理 器 集成 
在 一 个 芯片 上 ,所 以 多 处 理 器 得 到 了 更 加 
广泛 的 应 用 。 

一 个 对 称 多 处 理 器 结构 中 的 各 个 处 理 
器 共享 同一 个 地 址 空间 。 进 行 通 信和 时 ，, 一 
个 处 理 器 把 数据 写 到 某 个 内 存 位 置 , 然后 
由 其 他 处 理 吉 来 读 取 。 对 称 多 处 理 器 的 名 
字 就 是 源 于 所 有 的 处 理 器 能 够 以 统一 的 访 
问 时 间 来 访问 系统 中 所 有 的 内 存 。 图 11-1 
给 出 了 一 个 多 处 理 器 的 高 层 体 系 结构 。 各 
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个 处 理 器 都 拥有 自己 的 第 一 层 . 第 二 层 高 
HE, 有 时 甚至 拥有 第 三 层 高 速 缓存 。 





图 11-1 








最 高 层 的 高 速 缓存 通过 通常 的 共享 总 线 连接 到 物理 内 存 。 

对 称 多 处 理 器 使 用 一 致 缓存 协议 (coherent cache protocol ) 来 对 程序 员 隐 藏 高 速 缓存 的 存在 . 
在 这 样 的 协议 下 , 多 个 处 理 器 可 以 同时 保存 同一 高 速 缓存 线 的 多 个 拷贝 S, 前 提 是 它们 都 只 是 读 
取 数 据 。 当 一 个 处 理 器 想 向 -- 个 高 速 缓存 线 写 数据 时 , 所 有 其 他 的 高 速 缓 存 拷贝 都 被 删除 。 当 
一 个 处 理 器 请 求 的 数据 不 在 高 速 缓存 中 时 , 该 请 求 会 向 外 传递 到 共享 总 线 , 并 从 内 存 或 其 他 处 理 


器 的 高 速 缓存 中 获取 数据 。 


对 称 多 处 理 器 体系 结构 


一 个 处 理 器 和 另 一 个 处 理 器 通信 所 花 的 时 间 大 约 是 内 存 访问 时 间 的 两 倍 。 以 缓存 线 为 单位 
的 数据 必须 首先 从 源 处 理 器 的 高 速 缓存 写 到 内 存 中 , 然后 再 从 内 存 取出 放 到 第 二 个 处 理 器 的 高 
速 缓存 中 。 你 可 能 认为 处 理 器 之 间 的 通信 相对 便宜 , 因为 它 只 需要 大 约 两 倍 于 内 存 访问 的 时 间 。 
但 是 , 必须 记 住 , 相对 于 在 高 速 缓存 中 命中 的 访问 运算 ,内 存 访问 已 经 非常 昂贵 了 一 一 内 存 访 问 
可 能 慢 几 百倍 。 这 个 分 析 十 分 清楚 地 说 明了 高 效 并 行 化 和 局 部 性 分 析 之 间 的 相似 性 。 不 管 是 单 


独 工作 的 处 理 器 还 是 多 处 理 器 环境 下 的 处 理 器 , 要 使 它 高 效 工 作 就 必须 使 它 能 够 在 高 速 缓存 中 找 


到 运算 所 需 的 大 部 分 数据 。 

在 21 世纪 早期 , 对 称 多 处 理 器 的 设 
计 超 不 过 几 十 个 处 理 器 的 规模 ,原因 是 
受到 共享 总 线 或 任何 其 他 用 于 此 目的 的 
互联 设施 的 限制 。 它 们 在 速度 上 不 能 应 
对 不 断 增 加 的 处 理 器 数量 。 为 了 使 得 处 
理 器 设计 可 不 断 扩 大 规模 , 体系 结构 设 
计 师 们 又 在 内 存 层次 结构 中 引入 了 新 的 
一 层 。 他 们 不 再 使 用 和 各 个 处 理 器 距离 
一 样 远 的 内 存 , 而 是 把 内 存 分 配给 各 个 
处 理 器 , 以便 每 个 处 理 器 能 够 快速 访问 
它 的 局 部 内 存 , 如 图 11-2 所 示 。 因 此 远 


程 内 存 成 为 内 存 层次 的 下 一 级 , 它们 的 总 量 要 比 局 部 内 存 大 , 但 是 访问 时 花费 的 时 间 也 更 长 。 和 
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总 线 或 其 他 互 连 设施 





”你 可 以 做 习 一 下 7.4 节 中 对 高 速 缓存 和 高 速 缓 存 线 的 讨论 。 


图 11-2 分布 式 内 存 的 机 器 
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内 存 体系 结构 设计 时 高 速 存储 设备 必然 容量 较 小 的 原理 类 似 , 支持 处 理 器 之 问 快速 通信 的 机 器 
所 拥有 的 处 理 器 数量 也 必然 较 少 。 

有 两 种 不 同 的 带 有 分 布 式 内 存 的 并 行 机 : NUMA(NonUniform Memory Access, 不 一 致 内 存 访 
问 ) 机 器 以 及 消息 传递 机 器 。NUMA 体系 结构 为 软件 提供 了 一 个 共享 地 址 空间 , 允许 处 理 器 通过 
读 写 共享 内 存 来 通信 。 然 而 , 在 消息 传递 机 器 上 的 处 理 器 有 各 自 的 地 址 空间 ,处理 器 之 间 通 过 相 
互 传递 消息 来 通信 。 请 注意 ,虽然 为 共享 内 存 机 器 写 代码 要 相对 简单 , 但 任何 一 种 机 器 要 想 具 有 
好 的 性 能 , 都 要 求 软件 具有 良好 的 局 部 性 。 
11. 1.2 应 用 中 的 并 行 性 

我 们 使 用 两 种 高 层次 的 度量 来 估计 一 个 并 行 应 用 性 能 运行 的 好 坏 : 并 行 性 覆盖 率 和 并 行 性 
粒度 ,前 者 指明 了 并 行 执行 的 计算 过 程 所 占 的 百分比 ; 后 者 指出 了 各 个 处 理 器 在 不 和 其 他 处 理 器 
通信 或 同步 的 情况 下 能 够 运行 的 计算 量 。 一 个 特别 有 吸引 力 的 并 行 化 目标 是 循环 : 一 个 循环 可 
能 有 很 多 个 迭代 , 并 且 如 果 它 们 之 间 相 互 独立 , 我 们 就 找到 了 一 个 很 大 的 并 行 性 的 源头 。 

Amdahl 定律 

并 行 性 覆盖 率 的 重要 性 可 以 用 Amdahl 定律 简洁 地 表示 。Amdahl 定律 的 内 容 是 , WR SER 
并 行 化 代码 的 比率 , 并 且 如 果 并 行 化 版 本 在 一 个 有 p 个 处 理 器 的 机 器 上 运行 , 且 没有 任何 通信 或 
者 并 行 化 开销 , 那么 此 时 的 加 速 比 是 : 








I 
(1-f) + (f/p) 

比如 ,如 果 有 一 半 的 计算 是 串 行 执行 的 , 那么 不 管 我 们 使 用 多 少 个 处 理 器 , 计算 过 程 最 多 能 够 以 
双 倍 速度 运行 。 如 果 我 们 有 4 个 处 理 器 , 可 达到 的 加 速 比 是 1.6。 即 使 并 行 化 覆盖 率 达 到 90% , 
我 们 在 4 个 处 理 器 上 最 多 能 够 得 到 3 倍 的 加 速 比 , 而 在 无 限 多 的 处 理 器 上 得 到 的 加 速 比 最 多 
为 10。 

并 行 化 的 粒度 

理想 情况 是 一 个 应 用 的 全 部 计算 过 程 能 够 被 划分 成 为 很 多 粗 粒度 的 独立 任务 , 因为 我 们 可 
以 直接 把 不 同 的 任务 分 配给 不 同 的 处 理 器 。 这 样 的 例子 之 一 是 SETI( Search for Extra Terrestrial 
Intelligence, 寻找 外 星 智 慧生 物 ) 项 目 , 这 个 实验 使 用 很 多 通过 Internet 相连 的 家 庭 计 算 机 来 并 行 
分 析 射 电 望 远 镜 数 据 的 不 同 部 分 。 每 一 个 工作 单元 只 需要 少量 的 输入 并 生成 少量 的 输出 , 并且 
可 以 独立 于 所 有 其 他 单元 完成 。 由 于 这 些 原因 , 虽然 Internet 具有 相对 高 的 通信 延 时 和 低 带 宽 ， 
但 这 样 的 计算 工作 仍然 在 与 Internet 连接 的 机 器 上 运行 得 很 好 。 | 

大 部 分 应 用 要 求 处 理 器 之 间 有 更 多 的 通信 和 交互 , 但 仍然 支持 粗 粒 度 的 并 行 性 。 比 如 , 考虑 
一 个 Web 服务 器 , 它 负 责 响应 大 量 独 立 的 对 一 个 公共 数据 库 的 请 求 。 我 们 可 以 在 一 个 多 处 理 器 
机 器 上 运行 这 个 应 用 , 使 用 一 个 线程 来 实现 数据 库 访问 , 并 使 用 其 他 线程 来 对 用 户 请 求 提 供 服 
务 。 其 他 的 例子 包括 药物 设计 和 机 器 动 力学 模拟 。 在 这 些 例 子 中 ,人 们 可 以 独立 地 求解 针对 不 
同 的 参数 的 结果 。 在 模拟 的 时 候 ， 有 时 即使 对 于 一 组 参数 求解 也 会 花 很 长 时 间 , 因此 期 望 能 够 使 
用 并 行 化 技术 进行 加 速 。 当 一 个 应 用 中 的 可 用 并 行 性 的 粒度 降低 时 ,就 需要 更 好 的 处 理 器 之 间 
的 通信 支持 和 更 多 的 编程 工作 量 。 

很 多 运行 时 间 很 长 的 科学 及 工程 应 用 具有 简单 的 控制 结构 和 很 大 的 数据 集合 , 因此 它们 要 
比 上 面 讨论 的 应 用 更 容易 实现 更 细 粒 度 的 并 行 化 。 因 此 , 本章 主要 考虑 的 是 那些 用 于 数值 应 用 
的 技术 , 特别 是 那些 把 大 部 分 时 间 用 于 多 维 数组 中 的 数据 运算 的 应 用 。 下 面 我 们 就 探讨 一 下 这 
类 程序 。 
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11.1.3 循环 层次 上 的 并 行 性 

循环 是 并 行 化 的 主要 目标 , 在 使 用 数组 的 应 用 中 更 是 如 此 。 运 行 时 间 较 长 的 应 用 通常 具有 
大 型 数组 ， 从 而 产生 具有 很 多 和 迭代 的 循环 。 其 中 的 每 一 个 迭代 处 理 数 组 中 的 一 个 元 素 。 和 迭代 之 
间 相 互 独立 的 循环 并 不 难 找到 。 我 们 可 以 把 这 类 循环 的 大 量 和 迭代 分 配给 多 个 处 理 器 。 如 果 每 个 
迭代 的 工作 量 基本 相同 , 那么 简单 地 在 处 理 器 之 间 平 均 分 配 和 迭代 就 可 以 得 到 最 大 的 并 行 性 。 例 
11.1 是 一 个 特别 简单 的 例子 ， 它 说 明 我 们 如 何 利用 循环 层次 的 并 行 性 。 
国生 下面 的 循环 

for (i = 0; i < n; i+) { 

Z[i = X[i] - YCil; 
: Z[i] = Z[i] * 2Z[il; 


计算 了 向 量 天 和 了 的 元 素 之 间 的 平方 益 , 并 把 它们 存放 到 数组 2 中 。 这 个 循环 是 可 并 行 化 的 , A 
为 每 个 迭代 访问 不 同 的 数据 集合 。 我 们 可 以 在 具有 殉 个 处 理 器 的 计算 机 上 执行 这 个 循环 。 给 每 
， 个 处 理 器 赋予 唯一 的 一 p=0, 1, 2,…, M-1, 并 让 每 个 处 理 器 执行 同样 的 代码 : 
b = ceil(n/M); 
for (i = b*p; i < min(n,b*(pti)); i++) { 

Zi] = Xli] - Y(al; 

Z[i] = Z[i] * 2Z[i]:; 


我 们 把 这 个 循环 中 的 迭代 平均 分 配给 各 个 处 理 器 , 第 个 处 理 器 被 分 配 执 行 第 p 组 迭代 。 请 
注意 , 迭代 数目 不 一 定 能 够 被 MB, 因此 我 们 通过 在 程序 中 引入 一 个 求 最 小 值 的 运算 来 保证 
最 后 一 个 处 理 器 执行 的 时 候 不 会 越过 原来 的 循环 界限 。 口 














任务 层次 的 并 行 
有 可 能 在 一 个 循环 的 迭代 之 外 找到 并 行 性 。 比 如 , 我 们 可 以 把 两 个 不 同 的 函数 调用 或 两 
个 独立 的 循环 分 配给 两 个 处 理 器 。 这 种 形式 的 并 行 性 称 为 任务 并 行 性 (task parallelism) 。 和 
循环 层次 的 并 行 性 相 比 , 任务 层次 的 并 行 性 作为 一 个 并 行 性 来 源 的 吸引 力 较 弱 。 原 因 是 对 于 
每 个 程序 来 说 , 其 独立 任务 的 数量 是 固定 的 , 并 且 不 能 随 着 数据 大 小 的 增加 而 增加 。 而 一 个 
典型 循环 的 迁 代 次 数 则 会 随 数据 的 增加 而 增加 。 不 仅 如 此 , 这 些 任 务 的 大 小 通常 并 不 相等 ， 
因此 难以 让 所 有 的 处 理 器 在 所 有 时 间 都 有 事 可 做 。 











例 11.1 中 显示 的 并 行 代 码 是 一 个 SPMD(Single Program Multiple Data， 单 程序 多 数据 ) 程序。 
所 有 的 处 理 器 都 执行 相同 的 代码 ， 只 是 这 些 代码 都 带 有 各 个 处 理 器 的 唯一 标识 作为 参数 , 因此 不 
同 的 处 理 器 完成 不 同 的 动作 。 通 常会 有 一 个 被 称 为 主 处 理 器 ( master) 的 处 理 器 来 执行 计算 中 的 
所 有 串 行 部 分 。 在 到 达 代 码 中 已 并 行 化 的 部 分 时 ,， 主 处 理 器 激活 所 有 从 处 理 器 (stave) 。 所 有 从 
处 理 器 同时 执行 代码 中 已 经 被 并 行 化 的 区 域 。 在 每 个 并 行 化 代码 区 域 的 尾部 , 所 有 这 些 处 理 器 
参与 栅 障 同步 ( Bamier Syncehronization) 。 只 有 等 到 所 有 处 理 器 都 已 经 执行 完 它 们 进入 一 个 同步 栅 
障 之 前 的 全 部 运算 之 后 , 各 个 处 理 器 才 会 被 允许 离开 这 个 概 障 并 执行 栅 障 之 后 的 运算 。 

如 果 我 们 只 是 把 类 似 于 例 11. 1 中 的 简单 循环 并 行 化 , 那么 得 到 的 代码 通常 具有 较 低 的 并 行 
性 覆盖 率 和 相对 较 细 的 并 行 性 粒度 。 我 们 倾向 于 把 一 个 程序 的 最 外 层 循环 并 行 化 ,因为 这 样 会 得 
到 最 粗 的 并 行 性 粒度 。 比 如 , 考虑 二 维 FFT 变换 的 应 用 , 它 在 一 个 nxn 的 数据 集 上 运行 。 这 个 
程序 对 各 行 数据 执行 n 次 FFT 变换 , 然后 再 对 各 列 数据 执行 n 次 FFT 变换 。 我 们 倾向 于 把 ”个 
独立 FFT 变换 中 的 每 一 个 分 配给 一 个 处 理 器 ， 而 不 是 使 用 多 个 处 理 器 协作 完成 一 次 FFT 变换 。 
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这 样 做 使 得 代码 容易 书写 , 算法 的 并 行 性 覆盖 率 达 到 100% , 并且 代码 具有 很 好 的 数据 局 部 性 ， 
因为 在 计算 一 个 FFT 时 不 需要 进行 任何 通信 。 

很 多 应 用 没有 可 并 行 化 的 大 的 最 外 层 循环 。 然 而 , 这 些 应 用 的 执行 时 间 通 常 由 耗 时 的 内 核 
决定 。 这 些 内 核 可 能 具有 几 百 行 代码 , 包含 了 不 同时 套 层次 的 循环 。 有 时 可 以 单独 地 处 理 内 核 
部 分 , 通过 集中 考虑 它 的 局 部 性 , 重新 组 织 它 的 计算 过 程 并 把 它 分 划 成 为 多 个 独立 的 单元 。 
11.1.4 数据 局 部 性 

在 对 程序 进行 并 行 化 的 时 候 , 需要 考虑 两 种 略微 不 同 的 数据 局 部 性 概念 。 当 同一 个 数据 在 
短 时 间 内 被 多 次 使 用 时 就 产生 了 时 间 局 部 性 (temporal locality) 。 当 位 置 相近 的 不 同 数据 元 素 在 短 
时 间 内 被 使 用 的 时 候 就 产生 了 空间 局 部 性 (spatial locality ) 。 空 间 局 部 性 的 一 个 很 重要 的 形式 是 
在 同一 个 高 速 缓存 线 中 出 现 的 所 有 数据 元 素 被 一 起 使 用 。 这 种 形式 之 所 以 重要 的 理由 是 当 需 要 

一 个 来 自 某 高 速 缓存 线 的 元 素 时 ,这 个 高 速 缓 存 线 的 所 有 元 素 都 会 被 加 载 到 高 速 缓存 中 。 如 果 
很 快 就 会 使 用 这 些 元 素 , 那么 它们 很 可 能 还 在 高 速 缓存 中 。 这 种 空间 局 部 性 的 效果 使 得 高 速 缓 
存 脱 靶 的 概率 降 到 最 小 , 也 使 得 该 程序 得 到 了 较 好 的 加 速 比 。 

程序 的 内 核 经 常 可 以 使 用 多 种 不 同 的 方式 来 书写 。 它 们 之 间 在 语义 上 等 价 , 但 是 数据 局 部 
性 和 性 能 却 相差 很 大 。 例 11.2 给 出 了 例 11. 1 中 的 计算 过 程 的 另 一 种 表示 方法 。 

和 例 11. 1 类 似 ,下面 的 代码 也 能 够 计算 得 到 向 量 站 和 了 的 元 素 之 间 的 差 的 平方 。 
oF otal = eta) va; 

for (i = 0; i < n; i++) 

Z[i] = Z[i] * Z[i]; 

第 一 个 循环 计算 元 素 之 间 的 差 , 第 二 个 循环 计算 差 的 平方 。 这 样 的 代码 经 常会 在 实际 程序 
中 直到 ， ie en 机 ( vector machine) 优化 程序 的 办 法 。 向 量 机 是 -一 种 超级 计算 机 ， 
拥有 可 以 一 次 性 对 整个 向 量 进行 简单 算术 运算 的 指令 。 我 们 可 以 看 到 , 这 里 的 两 个 循环 在 例 
11.1 中 被 融合 (fuse) 为 一 个 循环 。 

我 们 已 经 知道 这 两 个 程序 完成 同样 的 计算 工作 , 那么 哪 一 个 程序 比较 好 呢 ? 例 11. 1 中 被 融 
合 在 一 起 的 循环 拥有 比较 好 的 性 能 ,因为 它 具 有 较 好 的 数据 局 部 性 。 每 个 差 值 一 生成 就 立刻 进 
行 平方 运算 。 实际 上 , 我 们 可 以 将 差 值 存放 在 一 个 寄存 器 中 , 求 它 的 平方 , 并 把 结果 一 次 性 写 入 
内 存 位 置 Z[i] 。 反 过 来 ,本 例 中 的 代码 需要 获取 Zi Kk, 并 对 它 写 两 次 。 不 仪 如 此 ,如果 数 
组 的 大 小 比 高 速 缓 存 大 , 那么 当 ZLi] 在 这 个 例子 中 被 第 二 次 使 用 时 , 需要 从 内 存 中 重新 获取 这 
个 值 。 因 此 , 这 个 代码 的 运行 速度 可 能 低 很 多 。 口 
假设 我 们 希望 把 按 行 存放 (回忆 一 下 6.4.3 节 ) 的 数组 2 设置 为 全 零 。 图 11-3a 和 图 11-3b 
分 别 对 这 个 数组 进行 逐 列 和 逐 行 扫描 。 我 们 可 以 对 图 11-3a 中 的 循环 进行 变换 得 到 图 11-3b 的 循环 。 
从 空间 局 部 性 的 角度 看 ， 以 逐 行 方式 执行 置 零 运算 是 比较 好 的 , 因为 在 一 个 高 速 缓存 线 中 的 所 有 字 都 
被 顺序 署 零 了 。 在 逐 列 处 理 的 方法 中 , 虽然 每 个 高 速 缓存 线 都 被 外 层 循 环 的 下 一 个 迭代 复 用 , 但 当 列 
的 大 小 比 高 速 缓存 大 的 时 候 , 高 速 缓存 线 在 被 复 用 之 前 就 会 被 抛 出 高 速 缓存 。 为 了 得 到 最 好 的 性 能 ， 
我 们 使 用 类 似 于 例 11. 1 中 所 使 用 的 方法 , 把 图 11-3b 的 外 层 循环 并 行 化 , 结果 如 图 11-3c 所 示 。 B 

上 面 的 两 个 例子 解释 了 和 操作 数组 的 数值 应 用 相关 的 几 个 重要 性 质 ， 

© 数组 代码 经 常 有 很 多 可 并 行 化 的 循环 。 

e 当 循 环 具 有 并 行 性 的 时 候 , 它们 的 迭代 可 以 按照 任意 的 顺序 执行 。 它 们 可 以 通过 重新 排 

序 大 幅 提 高 数据 局 部 性 。 
o 当 我 们 创建 出 大 的 相互 独立 的 并 行 计 算 单 元 时 ， 以 串 行 方式 执行 它们 往往 会 得 到 良好 的 
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for (j = 0; j < n; j++) for (i = 0; i < n; i++) 
for (i = 0; i < n; i++) for (j = 0; j < n; j++) 
ZLi,j] = 0; Z[i, jl = 0; 
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b = ceil(n/M); 
for (i = bxp; i < min(n,b*(pt1)); i++) 
for (j = 0; j < n; j++) 
Zli,j] = 0; 








c) 并 行 地 按照 逐 行 方 式 将 一 个 数组 置 零 
图 11-3 将 一 个 数组 置 零 的 顺序 代码 和 并 行 代码 


11.1.5 仿 射 变换 理论 概述 

编写 正确 且 高 效 的 串 行 程序 是 图 难 的 ,编写 正确 且 高 效 的 并 行程 序 则 更 加 困难 。 编写 的 难 
度 随 着 所 利用 的 并 发 性 粒度 的 降低 而 增长 。 我 们 在 上 面 看 到 过 ,程序 员 必 须 注意 数据 局 部 性 以 
获取 高 性 能 。 此 外 , 把 一 个 已 有 的 串 行 程序 并 行 化 的 任务 是 极端 困难 的 。 找 出 程序 中 的 所 有 依 
赖 关 系 很 困难 ， 当 这 个 程序 并 不 是 我 们 所 熟悉 的 类 型 时 尤其 如 此 。 调 试 一 个 并 行程 序 也 很 困难 ， 
因为 错误 可 能 是 不 确定 的 。 

在 理想 情况 下 ,一 个 并 行 的 编译 器 自动 地 把 普通 的 串 行 程序 翻译 成 高 效 的 并 行程 序 , 并 对 这 
些 程序 的 局 部 性 进行 优化 。 遗 憾 的 是 ,编译 器 并 不 知道 有 关 这 个 应 用 的 高 层 知识 , 它 只 能 保持 原 
算法 的 语义 ， 而 这 些 算法 未 必 适 合 进行 并 行 化 。 而 且 , 程序 员 也 可 能 随意 地 做 出 选择 , 结果 限制 
了 程序 的 并 行 性 。 

一 些 Fortran 数值 应 用 显示 了 并 行 化 和 局 部 性 优化 的 成 功 。 这 些 应 用 以 仿 射 访问 的 方式 对 数 
组 进行 操作 。 因 为 没有 指针 和 指针 运算 , 所 以 对 Fortran 的 分 析 相 对 容易 。 请 注意 , 不 是 所 有 的 
应 用 都 有 仿 射 访问 。 最 值得 注意 的 是 , 很 多 数值 应 用 是 在 稀疏 矩阵 上 运算 的 。 这 些 矩 阵 的 元 素 
是 通过 另 一 个 数组 间接 访问 的 。 本 章 关注 的 是 内 核 的 并 行 化 和 优化 , 这 些 内核 通 常 由 几 十 行 代 
码 组 成 。 - 

如 例 11.2 和 例 11.3 所 示 , 并 行 化 和 局 部 性 优化 需要 我 们 考虑 一 个 循环 的 不 同 实例 以 及 实例 
之 间 的 关系 。 这 个 情况 和 数据 流 分 析 有 着 很 大 的 不 同 。 在 数据 流 分 析 中 , 我 们 把 所 有 实例 的 相 
关 信 息 组 合 在 一 起 考虑 。 

对 于 带 有 数组 访问 的 循环 的 优化 问题 ， 我 们 使 用 三 种 类 型 的 空间 。 每 个 空间 可 以 看 成 是 一 
维 或 多 维 栅 格 中 的 点 集 。 

1) ERÈ N (iteration space) 是 在 一 次 计算 过 程 中 动态 执行 实例 的 集合 , 也 就 是 各 个 循环 下 
标的 取 值 的 组 合 

2) 数据 空间 (data space) 是 被 访问 的 数组 元 素 的 集合 

3) 处 理 器 空间 (processor space) 是 系统 中 的 处 理 器 的 集合 。 通 常情 况 下 ， 这 些 处 理 器 使 用 整 
数 或 者 整数 向 量 进行 编号 ,以 便 相互 区 分 。 

优化 问题 的 输入 是 各 个 迭代 被 执行 的 串 行 顺序 以 及 一 个 仿 射 的 数组 访问 函数 (例如 , XL + 
1 ) 。 这 个 函数 描述 了 迭代 空间 中 的 哪个 实例 访问 数据 空间 中 的 哪个 元 素 

这 个 优化 的 输出 也 是 用 仿 射 函数 表示 的 ， 它 定义 了 每 个 处 理 器 在 什么 时 候 做 什么 事情 。 为 

指明 每 个 处 理 器 所 做 的 工作 , 我 们 使 用 一 个 仿 射 范 数 把 原 和 迭代 空间 中 的 实例 映射 到 各 个 处 理 
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器 上 。 为 了 描述 什么 时 候 执行 先 代 , 我 们 使 用 一 个 仿 射 函 数 把 迭代 空间 中 的 实例 映射 成 为 一 个 
新 的 顺序 。 通 过 分 析 程 序 中 的 数组 访问 函数 所 理 涵 的 数据 依赖 关系 和 复 用 模式 ， 就 可 以 得 到 调 
度 方案 。 

下 面 的 例子 将 说 明 上 述 三 个 空间 一 迭代 空间 ,数据 空间 和 处 理 器 空间 。 它 也 非 正 式 地 介绍 
使 用 这 些 空间 来 并 行 化 代码 时 涉及 的 重要 概念 和 需要 解决 的 问题 。 在 后 面 的 各 节 中 将 详细 介绍 
这 些 概 念 
CEE 图 11-4 解释 了 下 面 程序 中 用 到 的 不 同 空间 和 这 些 空间 之 间 的 关系 。 


float 2(100]; 





























限定 。 这 个 例子 的 循环 定义 了 一 个 由 10 RER 


个 迭代 组 成 的 一 维 空间 。 空 间 中 的 迭代 
用 循环 下 标 变 量 的 值 : i =0, 1, …, 9 图 11-4 例 11.4 的 迭代 空间 、 数 据 空间 和 处 理 器 空间 


for (i = 0; i < 10; i++) 数据 访问 的 区 域 
. Z[i+10] = Z(il; < z 
这 三 个 空间 和 它们 之 间 的 映射 如 下 : z <2 2 1320 

1) ARE, 迭代 空间 是 循环 的 先生 i eee ee 
代 的 集合 。 各 个 迭代 的 D 通过 循环 下 标 He a 
变量 的 取 值 给 出 。 一 个 深度 为 d 的 循环 ERZI i a A 
Ke E d BREWER) Ad T SOE | 
下 标 变量 , 因此 被 建 模 为 一 个 d 维 空间 。 | joint 
迭代 空间 通过 循环 下 标 变量 的 上 下 界 来 1 

0 


I 9 


表示 。 

2) 数据 空间 : 数据 空间 由 数组 声明 直接 给 出 。 在 这 个 例子 里 , 数组 中 的 元 素 用 a =0, 1, 
99 作为 下 标 。 虽 然 所 有 的 数组 在 一 个 程序 的 地 址 空间 中 是 线性 存放 的 ， 我 们 还 是 把 n 维 向 量 当 
E n ETRE, 并 假设 各 个 下 标 总 是 在 它们 的 界限 之 内 。 当 然 , 这 个 例子 里 的 数组 是 一 维 的 。 

3) 处 理 器 空间 : 在 我 们 开始 并 行 化 时 ,假设 系统 中 有 无 限 多 个 虚拟 处 理 器 。 这 些 处 理 器 以 
多 维 空间 的 方式 进行 组 织 , 每 一 个 维度 对 应 于 我 们 试图 并 行 化 的 循环 蔡 套 结构 中 的 一 个 循环 。 
在 并 行 化 完成 之 后 , 如 果 我 们 拥有 的 物理 处 理 器 少 于 虚拟 处 理 器 , 就 把 虚拟 处 理 器 等 分 成 多 个 
块 , 每 一 块 分 配给 一 个 物理 处 理 器 。 在 这 个 例子 中 ， i aes Nets i amt 
分 配 一 个 处 理 器 。 在 图 11-4 中 , 我 们 假设 处 理 器 被 组 织 成 一 个 一 维 空间 且 用 0, 1，…, 9 进行 编 
号 。 特 环 的 第 ; 个 迁 代 被 分 配给 处 理 器 ;假如 只 有 五 个 处 理 器 ,我 们 可 以 把 迭代 0 和 1 分 配给 
处 理 器 0, 迭代 2 和 3 分 配给 处 理 器 1, 以 此 类 推 。 因 为 迭代 是 独立 的 , 所 以 只 要 五 个 处 理 器 中 的 
每 一 个 分 得 两 个 迭代 , 我 们 怎么 进行 分 配 并 不 重要 。 

4) 念 射 数 组 下 标 函数 : 代码 中 的 每 个 数组 访问 都 描述 了 一 个 从 迭代 空间 中 的 迭代 到 数据 空 
闻 中 的 数组 元 素 的 映射 。 如 果 这 个 访问 函数 是 把 各 个 循环 下 标 变量 乘 以 常量 并 求 和 , 然后 加 上 
一 些 常量 值 , 那么 这 个 函数 就 是 仿 射 的 。 本 例 中 的 两 个 数组 下 标 函 数 i+10 和 i 都 是 仿 射 的 。 我 
们 可 以 根据 访问 函数 求 出 被 访问 数据 的 维度 (dimension) 。 在 本 例 中 , 因为 每 个 下 标 函 数 只 有 一 
个 循环 变量 , 所 以 被 访问 数组 元 素 的 空间 是 一 维 的 。 

5) 仿 射 分 划 : 我 们 使 用 一 个 仿 射 函 数 把 一 个 迭代 空间 中 的 各 个 迭代 分 配给 处 理 器 空间 中 的 
各 个 处 理 器 , 由 此 把 一 个 循环 并 行 化 。 在 我 们 的 例子 中 , 我 们 直接 把 迭代 :i 分 配给 处 理 器 i, 也 可 
以 使 用 仿 射 函数 来 指定 一 个 新 的 执行 顺序 。 如 果 我 们 希望 以 相反 的 顺序 串 行 地 执行 上 面 的 循环 ， 
那么 可 以 用 一 个 仿 射 表达 式 10 -i 明确 指定 排序 函数 。 这 样 , 第 九 个 迭代 就 是 被 第 一 个 执行 的 选 
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Ai, 以 此 类 推 。 

6) 被 访问 数据 的 区 域 : 知道 一 个 选 代 所 访问 数据 的 区 域 有 助 于 找到 最 好 的 仿 射 分 划 。 把 和 迭 
代 空 间 的 信息 和 数组 下 标 函 数 结合 起 来 ,我们 就 可 以 得 出 被 访问 数据 的 区 域 。 在 本 例 中 , 数组 访 
问 Z[i+10] 触 及 的 空间 是 1al10<a<201，, 而 数组 访问 2[ 避 触及 的 空间 是 el0 入 c<10| 。 

7) 数据 依赖 : 为 了 确定 被 处 理 的 循环 是 否 可 被 并 行 化 , 我 们 需要 知道 在 各 个 迭代 之 间 是 和 否 
存在 数据 依赖 关系 。 在 这 个 例子 中 , 我 们 首先 考虑 该 循环 中 的 写 访问 之 间 的 依赖 关系 。 因 为 访 
问 函 数 ZLi+10] 把 不 同和 迭代 映射 到 不 同 的 数组 位 置 , 不 同 迁 代 向 数组 写 数 据 的 顺序 上 不 存在 依 
赖 关 系 。 那 么 在 读 访 问 和 写 访 问 之 间 存 在 依赖 关系 吗 ? 因 为 只 有 2Z[10], ZL11], =, Z[19]( 通 
过 访问 ZLi+10]) 被 写 , MRA Z[0], ZL1],…, ZL9]( 通 过 访问 Z[i) 被 读 , 因此 一 个 读 访问 
和 一 个 写 访 问 的 相对 顺序 不 存在 依赖 关系 。 因 此 , 这 个 循环 是 可 并 行 化 的 。 也 就 是 说 , 这 个 循环 
的 各 个 迭代 独立 于 其 他 所 有 的 迭代 , 我 们 可 以 并 行 地 执行 这 些 和 迭代 , 或 者 按照 我 们 选择 的 任意 顺 
序 执行 这 些 迭 代 。 但 是 请 注意 , 如 果 我 们 做 一 些 细 微 的 改动 ， 比 如 把 循环 下 标 i 的 上 界 改 成 10 或 
者 更 大 , 那么 就 会 存在 依赖 关系 。 因 为 数组 Z 的 某 些 元 素 会 在 一 个 迭代 中 被 写 , 然后 在 10 HK 
代 之 后 被 读 。 在 那 种 情况 下 , 这 个 循环 不 能 被 完全 地 并 行 化 , 我 们 将 不 得 不 仔细 考虑 如 何在 处 理 
器 之 间 分 配 和 迭代,， 以 及 如 何 对 迭代 进行 排序 。 口 

把 并 行 化 问题 写成 多 维 空间 和 这 些 空间 之 间 的 仿 射 映射 使 得 我 们 可 以 使 用 标准 的 数学 技术 
来 解决 并 行 化 和 局 部 性 优化 问题 。 比 如 ,可 以 通过 使 用 Fourier-Motzkin 消除 算法 消除 相应 的 变 
量 , 找 出 被 访问 数据 的 区 域 。 已 经 证 明 数 据 依 赖 性 和 整数 线性 规划 问题 等 价 。 最 后 , 寻找 仿 射 分 
划 的 问题 则 对 应 于 对 一 组 线性 约束 求解 。 如 果 你 不 熟悉 这 些 概念 也 不 用 着 急 , 因为 从 11. 3 节 开 
始 将 对 这 些 概 念 进行 解释 。 


11.2 FERRE: 一 个 深入 的 例子 


我 们 将 使 用 一 个 较 大 的 例子 来 介绍 并 行 编译 器 所 使 用 的 很 多 技术 。 在 本 节 中 , 我 们 将 研究 
大 家 熟悉 的 矩阵 相 乘 算法 ， 以 说 明 即 使 对 一 个 简单 且 易 于 并 行 化 的 程序 进行 优化 也 不 是 轻 而 易 
举 的 事 。 我 们 将 看 到 代码 改写 可 以 如 何 提高 数据 局 部 性 。 也 就 是 说 ， 和 选择 直接 运行 该 程序 相 
比 ， 处 理 器 只 需要 通过 少 得 多 的 (根据 不 同 的 体系 结构 ， 和 全 局 内 存 或 其 他 处 理 器 之 间 的 ) 通 信 
量 就 可 以 完成 它们 的 工作 。 我 们 也 将 讨论 如 何 利 用 可 以 存放 多 个 连续 数据 元 素 的 高 速 缓存 线 的 
特性 来 改进 像 矩 阵 乘 法 这 样 的 程序 的 运行 时 间 。 
11.2.1 FRB 

在 图 11-5 中 , 我 们 看 到 一 个 典型 的 矩阵 乘法 程序 2。 它 的 输入 是 两 个 mn xm 的 矩阵 下 和 也， 
它 产生 的 输出 存放 在 第 三 个 nxn 和 矩阵 Z 中 。 注 











T, Zi BER Z 在 第 i 行 第 j 列 上 的 元 素 将 变 成 人 02) 1 
n [i,j] = 0.0; 
2 per ikl hj i a 人 = ae < n; k++) 
图 11 沪 中 的 代码 生 成 蕊 个 秆 果 , ETAR | 人 
是 矩阵 不 的 某 行 和 矩阵 了 的 某 列 的 内 积 。 显 然 ， 
矩阵 2 的 每 一 个 元 素 的 计算 都 是 独立 的 ,因此 可 图 11-5 “基本 的 矩阵 相 乘 算 法 





O 在 本 章 中 的 程序 中 ,我 们 通常 将 使 用 C 语言 的 语法 , 但 是 为 了 使 得 多 维 数组 访问 ( 这 是 本 章 大 部 分 内 容 的 中 心间 
题 ) 的 代码 更 加 易于 理解 , 我们 将 使 用 Fortran 风格 的 数组 访问 , 也 就 是 说 , 使 用 Z[i, 门 而 不 是 Z[i] [jj。 
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以 并 行 执行 。 

n 的 值 越 大 , 算法 访问 各 个 元 素 的 次 数 就 越 多 。 也 就 是 说 ,这 三 个 矩阵 中 有 3m2 个 位 置 , 但 
是 这 个 算法 执行 中 次 运算 , 每 次 运算 把 臣 的 一 个 元 素 和 了 的 一 个 元 素 相 乘 并 把 乘积 加 到 Z 的 一 
个 元 素 中 。 因 此 算法 是 计算 密集 型 的 ， 从 原则 上 来 讲 内 存 访 问 不 应 该 成 为 瓶颈 。 

矩阵 乘法 的 串 行 执行 

我 们 首先 考虑 这 个 程序 在 单 处 理 器 上 顺序 运行 时 是 如 何 工 作 的 。 最 内 层 循环 读 写 Z 的 同 -- 
个 元 素 , 并 使 用 不 的 一 行 和 了 的 一 列 。 可 以 很 容易 地 把 Zi 门 放 到 一 个 寄存 器 中 , 不 需要 进行 内 
存 访问 。 不 失 一 般 性 , 假设 这 个 矩阵 是 按 行 存放 的 , 并 假设 < 是 高 速 缓存 线 中 的 数组 元 素 的 
个 数 。 

图 11-6 给 出 了 当 我 们 执行 图 11-5 中 的 外 层 循环 的 一 个 迭代 时 的 访问 模式 。 这 张 图 显示 的 是 
第 -- 个 选 代 的 情况 ,此 时 ;=0。 每 次 我 们 从 工 
的 第 一 行 的 一 个 元 素 移 动 到 下 一 个 元 素 时 ， Gi 
都 会 访问 了 的 某 一 列 中 的 各 个 元 素 . 在 _ 
图 11-6 中 可 以 看 到 假设 的 将 各 个 矩阵 组 织 成 = > 
高 速 缓存 线 的 方法 。 也 就 是 说 ,每 个 小 矩形 E 
表示 了 一 个 存放 四 个 数组 元 素 的 高 速 缓存 线 
( 即 在 此 图 中 , c=4 县 n =12)。 

对 蕊 的 访问 几乎 没有 增加 高 速 缓存 的 负 
担 。 半 的 一 行 只 分 布 在 n/c 个 高 速 缓存 线 中 。 Y 
如 果 这 一 行 元 素 可 以 被 一 起 放 到 高 速 缓存 中 ， 图 11-6 在 矩阵 乘法 中 的 数据 访问 模式 
对 于 一 个 给 定 的 下 标 i 的 值 只 会 发 生 n/c 次 高 速 缓存 脱 寺 ,而 整个 了 的 脱 革 数量 在 最 少 情况 下 为 
n?/e( 为 方便 起 见 , 我 们 假设 可 以 被 < 整除)。 

但 是 ， 当 使 用 不 的 一 行 时 , 该 矩阵 相 乘 算法 逐 列 访问 了 的 所 有 元 素 。 也 就 是 说 ， 当 /= 0 时 ， 
内 层 循 环 把 了 的 整个 第 一 列 都 搬 到 了 高 速 缓存 中 。 请 注意 , 该 列 的 所 有 元 素 存放 在 ”个 不 同 的 高 
速 缓 存 线 中 。 如 果 高 速 缓 存 大 到 (或 者 上 小 到 ) 可 以 存放 所 有 这 mn 个 高 速 缓存 线 ,并 且 没 有 对 高 
速 缓存 的 其 他 使 用 使 得 某 些 高 速 缓存 线 被 清除 出 高 速 缓存 , 那么 当 需 要 了 的 第 二 列 时 ,对 应 于 
j=0 的 列 仍然 在 高 速 缓存 中 。 在 此 情况 下 , 在 j=c 之 前 就 不 会 产生 次 对 了 的 脱 靶 。 当 7 = < 时， 
我 们 需要 把 对 应 于 了 的 另 一 组 完全 不 同 的 高 速 缓存 线 载 人 到 高 速 缓存 中 。 因 此 ,完成 外 层 循环 
的 第 一 个 迁 代 ( 即 计 = 0) 所 磁 到 的 高 速 缓存 脱 肢 次 数 在 mc Bn? 之 间 。 具 体 的 脱 靶 次 数 取 决 于 了 
的 高 速 缓存 线 列 能 否 从 第 二 个 循环 的 一 次 迭代 存活 到 下 一 个 迭代 。 

不 仅 如 此 ， 当 我 们 完成 i=1,2,… 外 层 循环 时 , 在读 取 了 的 元 素 时 可 能 会 碰 到 更 多 的 高 速 缓 
存 脱 靶 ,也 可 能 完全 没有 脱 靶 。 如 果 高 速 缓 存 大 到 可 以 把 了 的 所 有 n 个 高 速 缓存 线 -一 起 存放 
在 高 速 缓存 中 , 那么 就 不 会 再 磁 到 任何 脱 靶 。 因 此 ,整个 脱 靶 次 数 是 202/e, 一 半 在 访问 工时 发 
He, 另 一 半 在 访问 Y 时 发 生 。 但 是 , 如 果 目 标 机 器 的 高 速 缓 存 只 能 存放 了 的 一 列 , 而 不 是 全 部 ， 
那么 每 次 执行 外 层 循环 的 一 个 迭代 时 , 我们 需要 把 了 的 所 有 元 素 再 次 载 人 到 高 速 缓存 中 。 也 就 
是 说 , PURSE TEA KAGE n/c +n? /c, 其 中 的 第 一 项 是 访问 不 时 的 脱 靶 次 数 ,而 第 二 项 是 访 
问 了 时 的 脱 丢 次 数 。 在 最 坏 情 况 下 ,如 果 我 们 甚至 不 能 把 了 的 一 列 一 起 存放 在 高 速 缓存 中 , 那么 
外 层 循 环 的 每 次 迄 代 都 有 me MERATE, MIA n/n 次 脱 靶 。 

逐 行 并 行 化 

现在 我 们 考虑 可 以 如 何 使 用 多 个 处 理 器 ( 比如 说 p 个) 来 加 快 图 11-5 中 程序 的 执行 。 一 个 很 
显然 的 并 行 化 矩阵 乘法 的 方法 是 把 Z 的 各 行 分 配给 不 同 的 处 理 器 。 每 个 处 理 器 负责 n/p 个 连续 
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的 行 ( 为 方便 起 见 , 我 们 假设 4 可 以 被 bp 整除 )。 通 过 这 样 分 配 工作 盘 , 每 个 处 理 器 只 需要 访问 矩 
MEX AZ A n/p FF, 但 是 要 访问 整个 了 矩阵 。 每 个 处 理 器 将 计算 Z 的 n/p 个 元 素 。 为 了 计算 得 
到 这 些 元 素 , 它 需 要 进行 n/p KR - 加 法 运算 。 

这 样 做 之 后 , 虽然 计算 时 间 减 省 和 5p 成 正比 , 但 通信 开销 的 增长 实际 上 入 成 正比 。 也 就 是 
说 , 每 个 p 处 理 器 必须 读 取 m2]z 个 X 的 元素 , 但 是 要 读 取 了 的 所 有 n? 个 元 素 。 必 须 被 加 载 到 这 
p 个 处 理 器 的 高 速 缓存 中 的 高 速 缓存 线 的 总 数 最 少 为 n/c + pro, 这 两 项 分 别 对 应 于 加 载 世 和 
加 载 Y 副 本 的 数量 。 当 p 的 值 趋 近 于 时 , 计算 时 间 变 为 0(n?)，, 但 是 通信 开销 为 0(m) 。 也 就 
是 说 , 在 内 存 和 处 理 器 高 速 缓存 之 间 移 动 数据 的 总 线 成 为 性 能 瓶颈 。 因 此 ,对 于 给 定 的 数据 布局 
HA, 使 用 大 量 的 处 理 器 来 平分 计算 量 实际 上 会 降低 计算 速度 , 而 不 是 加 快 计算 速度 。 

11. 2.2 优化 

图 11-5 中 的 矩阵 相 乘 算法 说 明了 这 样 的 事实 : 即使 一 个 算法 可 能 复 用 同样 的 数据 , 它 的 数 
据 局 部 性 仍然 可 能 很 差 。 要 使 得 一 次 数据 复 用 能 够 在 高 速 缓存 中 命中 , 它 就 必须 在 该 数据 被 转 
移出 高 速 缓 存 之 前 发 生 。 在 本 例 中 , n 个 乘 -加 法 把 对 矩阵 了 中 同一 个 元 素 的 复 用 分 开 了 ,， 因 
此 数据 局 部 性 变 得 很 差 。 实 际 上 , n 次 运算 把 对 了 中 同一 高 速 缓存 线 内 的 数据 的 复 用 分 开 。 另 
外 ,在 -一 个 多 处 理 器 系统 中 ,只 有 当 数 据 被 同一 个 处 理 器 复 用 时 才 可 能 发 生 高 速 缓存 命中 事件 。 
当 我 们 在 11.2. 1 节 中 考虑 一 个 并 行 实现 时 , 我 们 看 到 了 的 元 素 必 须 被 每 一 个 处 理 器 使 用 。 因 此 ， 
对 了 的 复 用 并 没有 转化 为 局 部 性 。 

改变 数据 布局 

改善 一 个 程序 的 局 部 性 的 方法 之 一 是 改变 它 的 数据 结构 的 布局 。 比 如 , 把 了 按 列 存放 将 提 
高 对 矩阵 了 的 高 速 缓存 线 的 复 用 。 这 个 方法 的 应 用 范围 是 有 限 的 ,因为 同一 个 矩阵 通常 会 在 不 
同 的 运算 中 使 用 。 如 果 在 另 一 个 矩阵 乘法 运算 中 了 扮演 了 苞 的 角色 , 那么 又 会 因为 按 列 存放 而 
损害 效率 ， 因 为 在 一 个 乘法 运算 中 的 第 一 个 矩阵 按 行 存放 比较 好 。 

分 块 

有 时 可 以 通过 改变 指令 执行 的 顺序 来 改善 数据 局 部 性 。 但 是 循环 互 换 的 技术 并 不 能 提高 矩 
阵 乘法 例 程 的 效率 。 假 设 把 这 个 例 程 改写 成 每 次 生成 矩阵 Z 的 一 列 ， 而 不 是 一 行 。 也 就 是 说 , 把 
j 循环 变 成 外 层 循环 而 :循环 变 成 内 层 循环 。 假 设 这 些 矩 阵 仍 旧 按 行 存放 , 矩阵 了 就 有 比较 好 的 
空间 局 部 性 和 时 间 局 部 性 , 但 会 损害 矩阵 蕊 的 局 部 性 。 E 

分 块 (blocking) 是 另 一 种 对 循环 中 的 迭代 重新 排序 的 方 ye 
法 , 它 可 以 大 大 提高 一 个 程序 的 局 部 性 。 我 们 不 再 一 次 计算 结 
果 矩 阵 的 一 行 或 者 一 列 , 而 是 按照 图 11-7 中 所 示 把 矩阵 分 割 成 
ITEE, 或 者 说 块 。 然 后 , 我 们 对 运算 重新 排序 , 使 得 整个 
块 只 在 一 小 段 时 间 内 使 用 。 通 常情 况 下 , 这 些 块 是 边 长 为 8 的 
ENK. WEBER n, 那么 所 有 的 块 都 是 正方 形 。 如 果 BA 
能 整除 n, 那么 在 矩阵 下 面 或 右面 的 边 上 的 块 的 一 条 或 者 两 条 
边 的 长 度 小 于 B. 

图 11-8 显示 了 基本 和 抢 阵 相 乘 算法 的 一 个 版 本 。 在 这 个 版 7 l 
本 中 , 全 部 三 个 矩阵 被 划分 为 边 长 为 B 的 正方 形 。 和 图 11-5 A17 一 个 被 分 割 成 边 长 为 B 
中 一 样 , 假设 Z 已 经 被 初始 化 为 全 0 和 矩阵。 我 们 假设 B 整 除 n， 的 块 的 矩阵 
如 果 不 是 这 样 的 话 , 就 需要 把 第 (4) 行 中 的 上 限 修改 为 min(i + B,n) , 并 对 第 5 和 6 行 做 类 似 的 
修改 。 
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1) for (ii = 0; ii < n; ii = ii+B) 

2) for (jj = 0; jj <n; jj = jj+B) 

3) for (kk = 0; kk < n; kk = kk+B) 

4) for (i = ii; i < ii+B; i++) 

5) for (j = jj; j < jj+B; j++) 

6) for (k = kk; k < kk+B; k++) 

7) Z[i,j] = Z[i,j] + X[i,k]*Y[k,j]; 








图 11-8 基于 分 块 技术 的 矩阵 乘法 


外 面 的 三 层 循环 , 即 第 1 行 到 第 3 行 , 使 用 下 标 变量 立 . 广 和 所。 这 些 变 量 的 增 量 总 是 8, A 
此 它们 总 是 表示 了 某 个 块 的 左面 或 上 面 的 边 。 对 于 固定 的 立方 、 kk 的 值 , 第 4 行 到 第 7 行 计算 了 
VAX ui KEIM Y kkk, 六 为 左上 角 的 两 个 块 的 乘积 并 加 到 以 24, 门 为 左上 角 的 块 中 去 。 

ARETE XYZ 一 起 放 到 高 速 缓 存 中 时 ， 如 果 我 们 选择 了 适当 的 B 值 , 和 基本 算法 相 比 ， 
我 们 可 以 明显 地 降低 高 速 缓存 脱 靶 的 数量 。 选 择 BP 使 得 可 以 把 每 个 矩阵 的 各 个 块 一 起 放 到 缓存 
中 去 。 因 为 上 面 的 算法 中 各 个 循环 的 顺序 , 我 们 实际 上 只 需要 把 2 中 的 每 个 块 放 到 高 速 缓存 中 
一 次 就 可 以 了 。 因 此 ( 像 我 们 在 11.2.1 TEPEE E RE Feel ale 4 
Z 而 产生 的 高 速 缓存 脱 靶 。 

把 了 或 了 的 一 个 块 载 人 到 高 速 缓存 需要 P/E AEB. Wick ,c 是 一 个 高 速 缓存 线 
中 的 元 素 的 个 数 。 但 是 , 对 于 确定 的 分 别 来 自 关 和 了 的 块 , 我 们 在 图 11-8 的 第 4 行 到 第 7 行 中 进 
行 了 B 次 乘 -加 法 运算 。 因 为 整个 矩阵 乘法 需要 n 次 乘 -加 法 运算 , 所 以 把 两 个 块 加 载 进 缓存 
的 次 数 是 mm/ B3。 因 为 每 次 加 载 一 个 块 时 会 磁 到 2B?/c 次 高 速 缓存 脱 靶 ， 所 以 总 的 缓存 脱 靶 数量 
Æ 2n3/Be, 

把 这 个 数字 2n3/Be 和 11.2. 1 节 中 给 出 的 估计 值 相 比 是 很 有 意思 的 。 在 那 一 节 中 , 我 们 说 ， 
如 果 整 个 矩阵 可 以 一 起 放 到 高 速 缓存 中 的 话 ， 就 将 出 现 0( 双 /ce) 次 高 速 缓存 脱 靶 。 然 而 ,在 那 种 
情况 下 , 我 们 可 以 令 B=n,， 即 把 每 个 矩阵 当成 一 个 块 。 我 们 仍然 可 以 得 到 前 面 估 算 的 O(n?/c) 
次 高 速 缓存 脱 靶 。 另 一 方面 , 我 们 观察 到 如 果 不 能 把 整个 矩阵 放 到 高 速 缓存 中 , 就 需要 0(n3/c) 
次 高 速 缓存 脱 靶 , 甚至 O(n? ) 次 脱 靶 。 在 这 种 情况 下 , 假设 我 们 可 以 选择 相当 大 的 B 值 (比如 B 
可 以 是 200, 此 时 仍然 可 以 把 三 个 8 字 节 数字 的 块 放 到 一 个 1 MB 的 高 速 缓存 中 ) ,在 矩阵 乘法 中 
使 用 分 块 技术 有 很 大 的 优越 性 。 

分 块 技术 可 以 被 应 用 到 内 存 层次 结构 的 各 个 层次 上 。 比 如 , 我 们 可 能 希望 通过 把 一 个 2 x2 
矩阵 乘法 的 运算 分 量 都 放 到 寄存 器 中 , 以 优化 对 寄存 器 的 使 用 。 对 于 不 同 层次 的 高 速 缓存 和 物 
HAF, 我 们 使 用 逐渐 增 大 的 分 块 尺 寸 。 

类 似 地 , 我 们 可 以 把 各 个 块 分 布 到 不 同 的 处 理 器 上 , 以 便 使 数据 流量 达到 最 小 。 实 验 显 示 ， 
这 样 的 优化 在 单 处理 器 情况 下 的 性 能 加 速 比 可 以 达到 3 而 在 多 处 理 器 系统 上 的 加 速 比 几乎 和 所 
使 用 的 处 理 器 数量 成 线性 关系 。 





基于 块 的 矩阵 乘法 的 另 一 个 视点 
我 们 可 以 想象 图 11-8 PEREX, Y 2Z 并 不 是 nxn 的 浮 点 数 的 矩阵 ,而 是 (n/B) x (n/ 
8) 的 矩阵 ,而 这 个 矩阵 的 元 素 本 身 又 是 B xB 的 浮 点 数 的 矩阵 。 那 么 ,图 11-8 中 的 第 1 行 到 
第 3 行 就 像 是 图 11-5 中 的 基本 算法 的 三 个 循环 ,但 是 它们 处 理 的 矩阵 的 大 小 是 n/B, 而 不 是 7。 
我 们 可 以 把 图 11-8 的 第 4 行 到 第 7 行 看 作 是 图 11-5 中 的 单个 乘 - 加 法 运算 的 实现 。 请 注意 ， 
在 这 个 运算 中 的 单个 乘法 步骤 对 应 于 一 个 拢 阵 乘法 步骤 ,使 用 了 图 11-5 中 对 元 素 为 浮 点 数 的 
两 个 矩阵 相 乘 的 基本 算法 。 殖 阵 加 法 就 是 各 个 元 素 上 的 浮 点 数 加 法 。 
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11.2.3 高 速 缓存 干扰 

遗憾 的 是 ,对 于 高 速 缓存 的 利用 还 有 一 些 问题 要 解决 。 大 部 分 高 速 缓存 不 是 完全 结合 的 ( 见 
7.4.2 节 )。 在 一 个 直接 映射 的 高 速 缓存 中 ,如 果 是 高 速 缓存 大 小 的 倍数 , 那么 一 个 nxn WH 
阵 的 同一 行 中 的 各 个 元 素 将 竞争 同样 的 高 速 缓存 位 置 。 在 那 种 情况 下 , 把 某 列 的 第 二 个 元 素 加 
载 进 高 速 缓存 将 会 把 第 一 个 元 素 的 高 速 缓存 线 挤 出 高 速 缓存 。 即 使 高 速 缓存 有 能 力 同时 存放 所 
有 这 些 高 速 缓存 线 , 这 样 的 情况 仍然 会 发 生 。 这 种 情况 被 称 为 高 速 缓存 干扰 (cache interference) 。 

对 于 这 个 问题 有 多 种 解决 方法 。 第 一 个 方法 是 一 劳 永 逸 地 重新 排列 数据 ,使 得 被 访问 的 
数据 放 在 连续 的 数据 位 置 上 。 第 二 个 方法 是 把 n xn 的 数组 放 在 一 个 较 大 的 m xn 的 数组 中 ， 
我 们 可 以 选择 适当 的 m 来 最 小 化 干扰 问题 。 第 三 种 方法 是 选择 一 个 可 以 保证 避免 干扰 的 分 块 
大 小 。 
11.2.4 11.2 节 的 练习 

练习 11. 2. 1: 和 图 11.5 中 的 代码 不 同 , 图 11.8 中 的 基于 块 的 矩阵 相 乘 算 法 中 不 包含 把 矩阵 
Z 的 所 有 元 素 清 零 的 初始 化 部 分 。 在 图 11-8 中 加 入 把 Z 初始 化 为 全 零 矩 阵 的 步骤 。 


11.3 和 迭代 空间 


本 节 的 研究 动机 是 充分 利用 11. 2 节 中 提 到 的 优化 技术 。 对 于 一 些 简单 情况 ,比如 矩阵 乘法 ， 
这 些 技术 是 相当 简单 明了 的 。 对 于 更 加 一 般 的 情况 ,同样 的 技术 仍然 可 用 , 但 此 时 它们 的 应 用 就 
远 没有 那么 直观 了 。 然 而 , 通过 应 用 一 些 线性 代数 技术 , 我 们 可 以 使 得 这 些 技术 能 够 完成 对 一 般 
情况 的 优化 。 

11. 1.5 节 中 讨论 过 , 我 们 的 转换 模型 中 有 三 种 空间 : 迭代 空间 数据 空间 和 处 理 器 空间 。 这 
里 我 们 首先 从 迭代 空间 开始 。 一 个 循环 嵌 套 结构 的 迭代 空间 被 定义 为 该 嵌 套 结构 中 所 有 循环 下 
标 变量 取 值 的 组 合 。 

和 图 11-5 中 的 矩阵 乘法 的 例子 一 样 ， 迭代 空间 常常 是 矩形 的 。 在 那 种 情况 下 ,每 个 嵌 套 中 
的 循环 具有 下 界 0 和 上 界 n-1。 但 是 , 在 更 复杂 但 相当 现实 的 循环 说 套 结构 中 , 一 个 循环 下 标的 
上 界 和 下 界 可 能 依赖 于 较 外 层 循环 的 下 标 值 。 我 们 很 快 会 看 到 这 样 的 一 个 例子 。 

11.3.1 从 循环 嵌 套 结构 中 构建 迭代 空间 

让 我 们 首先 描述 一 下 即将 学 习 的 技术 能 够 处 理 哪些 类 型 的 循环 嵌 套 结构 。 每 个 循环 有 -个 
唯一 的 循环 下 标 , 我 们 假设 每 次 迭代 这 个 下 标 增加 1。 这 个 假设 并 没有 失去 一 般 性 ,因为 如 果 每 
次 迭代 的 增 量 是 大 于 1 的 整数 , 那么 总 是 可 以 把 对 下 标 i 的 使 用 蔡 代为 ci ta, 其 中 a 是 某 个 正 
或 负 的 常数 , 然后 循环 中 的 每 次 迭代 将 i 加 1。 这 个 循环 的 上 下 界 必须 写成 其 外 层 循环 的 下 标的 
仿 射 表达 式 。 
考虑 下 面 的 循环 


for (i = 2; i <= 100; i = i+3) 
Z[i] = 0; 


该 循环 的 每 轮 运行 把 循环 下 标 i 加 3, 它 的 效果 是 把 各 个 数组 元 素 Z[2],， 215], 718), 0, 
2Z[98] 设置 为 0。 我 们 可 以 使 用 下 面 的 循环 来 得 到 同样 的 效果 : 


for (j = 0; j <= 32; j++) 
Z[3*j+2] = 0; 


也 就 是 说 , 我 们 用 37+2 BAT io 下 界 1=2 变 成 了 j =0( 只 需要 求解 方程 3 +2 = 2 就 可 得 到 j 的 
值 ), 而 上 界 i<100 变 成 了 j<32( 将 了 +2 志 100 简化 可 得 j 生 32. 67, 又 因为 了 必须 是 整数 , 所 以 要 
舍弃 小 数 部 分 ) 。 ` 口 
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通常 情况 下 , FRA TE A EPS PY for 循环 结构 。 对 于 一 个 while 循环 或 者 repeat 
循环 , 如果 存在 -~ 个 下 标 以 及 该 下 标的 上 下 界 , 那么 它 就 可 以 被 替换 为 一 个 for 循环。 图 11-9a 
中 的 循环 就 是 这 样 的 情况 。 一 个 像 for(i =0;i <100;i++) 这 样 的 for 循 环 可 以 达到 同样 的 
目标 。 








i=0; i=0; 

while (i<100) { while (1) { 
< 一 些 和 i 无 关 的 语句 > < 一 些 语句 > 
i= iti; i = itt; 

} } 











a) 一 个 具有 明显 界限 的 while 循 环 b) 不 清楚 这 个 循环 在 什么 时 候 或 是 否 会 终止 







i= 0; 

while (i<n) { 
“一 些 与 ji 及 na 无 关 的 语句 > 
i= iti; 


} 
o 我 们 不 知道 的 值 .因此 我 们 不 知道 这 个 循环 什么 时 候 终 目 








图 11-9 一 些 while 循环 


但 是 有 些 while 循环 或 repeat 循环 没有 明显 的 界限 。 比 如 , 图 11-9b 中 的 例子 可 能 会 中 止 , 也 
可 能 不 会 终止 , 但 是 没有 办 法 指出 在 未 知 的 循环 体 中 i 满足 什么 条 件 时 程序 会 跳出 该 循环 。 图 
11-9c 是 另 一 个 会 出 现 问题 的 情况 。 例 如 , 变量 ”可 能 是 一 个 函数 的 参数 。 我 们 知道 循环 迁 代 n 
次 , 但 是 在 编译 时 刻 我 们 不 知道 的 值 是 什么 。 实 际 上 , 我 们 可 能 期 望 该 循环 在 不 同 的 执行 中 大 
代 的 次 数 不 同 。 在 图 11-9b 和 图 11-9c 这 样 的 情况 下 , 我 们 必须 把 i 的 上 界 当 作 无 限 来 处 理 。 

一 个 深度 为 a 的 循环 嵌 套 结构 可 以 被 建 模 为 一 个 d 维 空间 。 空 间 的 各 个 维 是 有 序 的 ,第 大 维 
表示 该 舱 套 结构 中 从 最 外 层 循环 起 的 第 上 个 拍 环 。 这 个 空间 中 的 一 个 点 (1 ,x ,…,xa) 表 示 所 有 
这 些 循环 下 标的 值 , 最 外 层 循环 下 标的 值 是 x , 第 二 个 循环 下 标的 值 是 x， 以 此 类 推 。 最 内 层 特 
环 下 标的 值 是 x4。 

但 并 不 是 这 个 空间 中 的 每 个 点 都 代表 了 一 个 在 该 循环 嵌 套 结构 执行 时 实际 出 现 的 下 标 取 
值 组 合 。 作 为 外 层 循 环 下 标的 一 个 仿 射 函 数 , 每 个 循环 的 上 下 界 都 定义 了 一 个 不 等 式 , 它 把 
空间 分 成 两 半 : 对 应 于 循环 和 迭 代 的 部 分 ( 即 正 的 半空 间 ) 和 不 对 应 于 和 迭代 的 部 分 ( 即 负 的 半空 
间 ) 。 所 有 线性 不 等 式 的 交 (逻辑 AND ) 表 示 这 些 正 的 半空 间 的 交集 , 该 交集 定义 了 一 个 凸 多 
面体 ( convex polyhedron) 。 我 们 把 这 个 风 面 体 称 为 这 个 循环 拒 套 结构 的 选 代 空间 (iteration 
space) 。 一 个 凸 多 面体 具有 以 下 性 质 : 如 果 两 个 点 在 该 多 面体 内 , 那么 它们 之 间 的 连 线 上 的 所 
有 点 都 在 该 多 面体 内 。 多 面体 使 用 循环 界限 不 等 式 描述 。 循 环 的 每 个 迭代 都 可 以 由 该 多 面体 
中 的 具有 整数 坐标 的 点 表示 。 反 过 来 ,在 多 面体 内 的 每 个 整数 点 都 代表 了 该 循环 嵌 套 结构 在 某 
个 时 候 执行 的 一 个 迁 代 。 

DEG 考虑 图 11-10 中 的 二 维 循环 工 套 结构 。 我 们 可 以 使 

用 图 11-11 中 显示 的 二 维 多 面 体 对 这 个 深度 为 2 HIRE | tor G = 0; ic 8; in 
构建 模 。 图 中 的 两 个 轴 表 示 循环 下 标 i 和 j 的 值 。 下 标 i 可 以 pe ee ae 
取 0 -5 之 间 的 任何 整数 值 ; 下 标 j 可 以 取 满足 i<j<7 的 任何 
整数 值 。 O 图 11-10 一 个 二 维 循环 雹 套 结构 
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图 11-11 例 11.6 的 迭代 空间 





迭代 空间 和 数组 访问 
在 图 11-10 的 代码 中 , 迭代 空间 也 是 数组 Z 中 被 该 代码 访问 到 的 部 分 。 这 种 类 型 的 访问 
是 很 常见 的 , 它们 的 数组 下 标 就 是 按 某 种 顺序 排列 的 循环 下 标 。 但 是 , 我 们 不 应 该 把 迁 代 空 
闻 和 数据 空间 相 混 消 。 和 迭代 空间 的 各 个 维度 是 各 循环 下 标 。 假 设 我 们 在 图 11-10 的 代码 中 使 
用 一 个 类 似 于 Z[2* ii+ 刀 的 数组 访问 来 蔡 换 Z (7,1), 那么 迭代 空间 和 数据 空间 之 间 的 区 别 
| 就 很 明显 了 。 | 


11. 3. 2 ”循环 嵌 套 结构 的 执行 顺序 

一 个 循环 霸 套 结构 的 顺序 执行 按照 上 升 的 词典 顺序 逐个 执行 它 的 迁 代 空间 中 的 各 个 氨 代 。 
ASHE E = Lig sig sig HIRI DPB = LID ih, IE <i, BEAL 
当 存在 一 个 m< min(n,n') 使 得 [i 和 sis] = Lids sIFR insi <i ere WER, m 可 
以 等 于 0, 实际 上 这 种 情况 很 常见 。 
OREA iei 当 作 外 层 循环 , 例 11.6 中 的 人 循环 说 套 结构 的 先 代 按照 图 11-12 所 示 的 顺序 执行 。 





























口 
[0 O}, [0,1], [0 ] [0,3], [0,4], [0,5], [0,6], [0,7] 
1,1), (1.2) m3 g 5h 16), 07 
[2,2], [2,3], [2,4], [2,5], [2,6], [2,7 
[3,3]. [3,4], [8,5]. [3,6], [3,7] 
4,4], [4,5], [46], [4.7] 
| [5,5], [5,6], [5.7] 
图 fi-12 图 11-10 中 的 循环 罕 套 的 迭代 的 执行 顺序 
11.3.3 ”不等式 组 的 矩阵 表示 方法 
在 一 个 深度 为 d 的 循环 退 套 中 的 迭代 可 以 用 数学 方式 表示 为 
在 Ze 中 |Bi+b 宕 0| (11.1) 
其 中 : 


1) Z( 按 照 数学 惯例 ) 表示 整数 的 集合 一 一 包括 正 整数 、. 负 整数 和 零 。 
2) B 是 一 个 d xda 的 整数 和 矩阵 。 
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3) b 是 一 个 长 度 为 d 的 整数 向 量 。 
4) 0 是 一 个 由 d 个 零 组 成 的 向 量 。 











A 我 们 可 以 把 例 11.6 中 的 不 等 式 写成 图 11-13 中 的 形式 。 也 就 是 说 , i 的 范围 用 iSO 和 
i<5 表示 ; j 的 范围 用 j 宇 i 和 j<7 表示 。 我 们 要 求 这 A arene 
些 不 等 式 都 能 写成 ui +y +w ed HIBS. RIK, Lu, ee ee ey o 
v] 变 成 了 不 等 式 (11. 1) 中 给 阵 B 的 一 行 , w 变 成 向 量 -1 了 
b 中 的 相应 元 素 。 比 如 , i20 就 是 这 种 形式 , 其 中 = 0 -i 74 Lod 
1, v=0, w=0。 这 个 不 等 式 用 图 11-13 中 B 的 第 一 行 图 11.13 pepe eer EHR 
ae aa 式 ,表示 用 二 定义 一 个 泛 代 空间 的 不 等 式 组 


看 另 一 个 例子 , 不 等 式 i<5 等 价 于 ( -1)i+ (0)j+5 


最 后 , j<7 BM(0)i+(-1)j+720, 由 图 中 矩阵 和 向 量 的 最 后 一 行 表示 。 口 





处 理 不 等 式 

为 了 像 例 11. 8 中 那样 转换 不 等 式 , 我 们 可 以 像 处 理 等 式 一 样 进 行 转换 。 比 如 , 在 不 等 
式 两 边 都 增加 或 减少 同样 的 值 , 或 将 两 边 都 乘 以 同样 的 常量 。 我 们 必须 记 住 的 唯一 特殊 规 
则 是 ， 当 我 们 把 不 等 式 两 边 都 乘 以 一 个 负数 的 时 候 , 必须 改变 不 等 号 的 方向 。 因 此 , i<5 
乘 以 -1 就 变 成 -i= -5。 给 不 等 式 两 边 都 加 上 5 得 到 -~i+550, 实际 上 就 是 图 11-13 的 
第 二 行 。 
11.3.4 混合 使 用 符号 常量 

有 时 我 们 需要 对 涉及 某 些 变量 的 循环 说 套 结构 进行 优化 , 这 些 变 量 对 于 该 柑 套 中 的 所 有 循 
环 都 是 循环 不 变 的 。 我 们 把 这 样 的 变量 称 为 符号 常量 (symbolic constant) , 但 是 为 了 描述 一 个 选 
代 空 间 的 边界 , 我 们 需要 把 它们 当 作 变 量 进 行 处 理 , 并 在 循环 下 标 变 量 组 成 的 向 量 中 为 它们 创建 
一 个 条 目 。 这 个 向 量 就 是 通用 不 等 式 (11. 1) 中 的 向 量 i。 
考虑 下 面 的 简单 循环 : 


for (i = 0; i <= n; itt) { 








} 
这 个 循环 定义 了 一 个 一 维 的 迭代 空间 ,下 标 变 量 是 i, 界限 是 ;>0 和 is<n。 因 为 n 是 一 个 符号 常 
量 , 我 们 需要 把 它 当 作 一 个 变量 包括 进来 , 得 到 一 个 循环 下 标的 向 量 [i,n]。 按 照 矩 阵 - 向 量 的 
形式 ,这 个 和 迭代 空间 被 定义 为 
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请 注意 ， 虽 然 数 组 下 标的 向 量具 有 两 个 维度 , 但 它们 中 只 有 表示 i 的 第 一 维 是 输出 部 分 ， 即 
迭代 空间 的 点 集 。 
11. 3.5 控制 执行 的 顺序 

从 一 个 循环 体 的 上 下 界 中 抽取 到 的 线性 不 等 式 定 义 了 一 个 凸 多 面体 上 的 和 欠 代 的 集合 。 这 个 
表示 方法 并 没有 假定 在 友 代 空 间 中 的 送 代 之 间 的 任何 执行 顺序 。 原 程序 在 迭代 之 上 强加 了 一 个 
串 行 顺序 , 该 顺序 就 是 按照 从 外 到 内 方式 排列 的 循环 下 标 变量 取 值 的 词典 排序 。 但 是 , 只 要 遵守 
它们 之 间 的 数据 依赖 关系 ( 即 循环 拒 套 结构 中 不 同 赋值 语句 所 执行 的 对 任 一 数组 元 素 的 写 / 读 操 
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作 的 顺序 没有 改变 ) ,就 可 以 按照 任何 顺序 执行 该 空间 中 的 和 迭代。 

如 何 选择 一 个 既 遵 守 数据 依赖 关系 ， 又 能 优化 数据 局 部 性 和 并 行 性 的 顺序 是 很 困难 的 问题 ， 

我 们 稍 后 将 从 11.7 节 开 始 处 理 这 个 问题 。 这 里 我 们 假设 已 经 有 了 一 个 合法 且 令 人 满意 的 排序 ， 
说 明 如 何 生成 遵守 这 个 顺序 的 代码 。 首 先 让 我 们 讨论 例 11. 6 中 的 另 一 个 排序 。 
在 例 11.6 的 程序 中 , 迁 代 之 间 没 有 数据 依赖 关系 。 因 此， 可 以 用 串 行 或 者 并 行 的 方 
式 执行 这 些 选 代 。 因 为 在 此 代码 中 迭代 [i 门 访问 了 元 素 ZU, i], 原 程序 按照 图 11-14a 中 的 顺序 
访问 数组 。 为 了 提高 空间 局 部 性 ,我们 更 愿意 像 图 11-14b 所 显示 的 那样 连续 地 访问 数组 中 的 令 
近 元 素 。 












































Z(0,0}, 2[1,0], 2(2,0], 2[3,0], 24.0], 2[5,0l, 2Z[6,0], 2[7,0] 
Zl, ziza) zi], 2(4,1], 2[5,1], 26.1), 20,7 
2[2,2], 2[3,2],， Z[4,2], 2[5,2],， 2[6,2], 2[7,2] 
2[3,3], 2[4,3], 2[5,3], Z[6,3]), 2[7,3] 
2(4.4], Z(5,4]. [6.4], Z[7,4] 
25,5], 2(6,5), Z[7,5)- 
a) 原来 的 访问 顺序 
2[0, 0] 0,0 
Z{1,0), 2(1,1) 0,1]， H 
2Z[2,0], 2[2,1], 2[2,2] [0,2]，[1,2]，[2.2] 
2[3,0]), 2{3,1], 2[3,2], 2[3,3] (0,3), [1,3], [2,3], [3,3] 
2Z[4,0], 2[4,1], Z{[4,2], 2[4,3], Z[4,4] 0,4], (1,4), (2,4), [8,4], [4.4] 
2(5,0), 2[5,1], 2[5,2}, 2{5,3), 2[5,4], 2[5,5] 0.5), [1.5], [2,5]. [3.5], [4,5], [5,5] 
Z(6,0], 2(6,1], 26,2], 2[6,3], 2(6,4], 2(6,5] 0,6], [1,6], [2,6], (3,6), [4,6], [5,6] 
Z(7,0}, 2[7,1], 2[7,2], 2[7,3], [7,4], 2[7,5] 0,7], (1,7, [2.71 [3,7], (47), [5,71 
b) 更 好 的 访问 顺序 c) BE FPA PCE 


图 11-14 — PRM ERENT GEA E HEY 


如 果 我 们 按照 图 11-14c 中 的 顺序 执行 循环 的 迭代 ,就 能 够 得 到 上 面 的 访问 模式 。 也 就 是 说 ， 
我 们 垂直 地 ( 而 不 是 水 平地 ) 扫描 图 11-11 中 的 迭代 空间 , 因此 7 变 成 了 外 层 循 环 的 下 标 。 按 照 上 
面 的 顺序 执行 这 些 迭 代 的 代码 是 

for (j = 0; j <= 7; j++) 

for (i = 0; i <= min(5,j); i++) 


Z(j,i] = 0; 口 

给 定 一 个 凸 多 面体 和 一 个 下 标 变量 的 排序 , 我 们 该 如 何 生 成 循环 的 界限 , 使 得 循环 能 够 按照 
这 些 变 量 的 词典 排序 扫描 这 个 迭代 空间 ? 在 上 面 的 例子 中 , AR i<j 在原 程 序 中 是 作为 内 层 循 
环 下 标 7 的 下 界 出 现 的 , 但 是 在 转换 得 到 的 程序 中 它 作为 内 层 循 环 下 标 i 的 上 界 出 现 。 

最 外 层 循 环 的 界限 是 用 符号 常量 和 常量 的 线性 组 合 来 表示 的 ， 它 定义 了 该 循环 下 标的 全 部 
取 值 的 范围 。 内 层 循 环 的 下 标 变量 的 界限 用 较 外 层 循 环 的 下 标 变量 、 符 号 常量 和 常量 的 线性 组 
合 来 表示 。 对 于 给 定 的 较 外 层 循 环 下 标 变 量 的 每 个 取 值 组 合 , 它们 定义 了 该 循环 下 标 变量 的 取 
值 范围 。 

投影 

从 几何 学 的 角度 来 讲 , 我 们 可 以 把 表示 选 代 空 间 的 凸 多 面体 投影 (projectiog ) 到 该 空间 中 对 
应 于 较 外 层 循环 的 维度 上 , 以 得 到 一 个 深度 为 2 的 循环 伐 套 结构 中 外 层 循 环 下 标 变量 的 循环 界 
限 。 直 观 地 讲 , 一 个 多 面体 在 一 个 较 低 维度 空间 的 投影 就 是 该 物体 在 这 个 空间 中 的 影子 。 图 
11-11 中 的 二 维 近代 空间 到 i 轴 上 的 投影 是 从 0 到 5 的 垂直 线 ; 而 到 j 轴 的 投影 是 从 0 到 7 的 水 平 
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线 。 当 我 们 把 一 个 3 维 物体 沿 着 z 轴 投 影 到 -一 个 二 维 的 x-y 的 平面 上 时 , 我 们 消除 变量 z， 失 去 


了 各 个 点 的 高 度 信息 ,而 仅仅 记录 下 该 物体 在 x* -7 平面 上 上 的 二 维 荐 盖 区 域 。 

循环 界限 生成 只 是 投影 的 多 种 用 途 之 一 。 投 影 的 正式 定义 如 下 。 令 5 为 一 个 n 维 多 面体 。 
S 到 它 的 前 m 个 维度 的 投影 是 满足 如 下 条 件 的 点 (x1 ,za tm) 存在 x ;1 Xm ars ,Xa 使 得 
向 量 [xi ,x2,… ,Xj] 在 S$ 中。 我 们 可 以 使 用 Fourier-Motzkin 消除 算法 来 计算 投影 。 下 面 介绍 该 





Fourier-Motzkin 消除 算法 。 

输入 : 一 个 带 有 变量 x, ,x2,…,% 的 多 面体 S$。 也 就 是 说 ,5 是 关于 变量 x; 的 一 组 线性 约束 。 
一 个 给 定 的 变量 * 是 被 指定 需要 消除 的 变量 。 

输出 : 一 个 关于 变量 x] 00m -1 Mma n ( BIRR sn 之 外 的 所 有 5 的 变量 ) 的 多 面体 5'。 
SE S 到 除 第 m 个 维度 之 外 的 所 有 维度 的 投影 。 

方法 : 令 C 是 5S 中 所 有 涉及 x%,, 的 约束 的 集合 。 执 行 下 列 步 又 : 

1) 对 于 C 中 关于 en 的 每 一 对 上 界 和 下 界 ， 比 如 


LSC, Xm 
© €9%_ SU 
建立 一 个 新 的 约束 
cL<ciU 


请 注意 , c 和 c 是 整数 , (AL MU 可 能 是 关于 除 zn 之 外 的 其 他 变量 的 表达 式 。 

2) 如 果 整数 c1 Me 有 公 因子 , 将 上 面 约束 的 两 边 都 除 以 这 个 因子 。 

3) 如 果 新 的 约束 是 不 可 满足 的 , 那么 5 无 解 , 即 多 面体 $ 和 5' 都 是 空 的 空间 。 

4) 5' 是 约束 集合 S - C 加 上 在 第 2 步 中 生成 的 所 有 约束 。 

顺便 说 一 下 , 如果 x, 具有 个 下 界 和 vw 个 上 界 , 消除 sn 最 多 会 产生 ww 个 不 等 式 。 m 

在 算法 11. 11 的 第 一 步 中 引入 的 约束 对 应 于 约束 集合 C 所 蕴涵 的 对 系统 中 其 余 变 量 的 约束 。 
因此 ，S' 中 有 一 个 解 的 充 要 条 件 是 S 中 至 少 有 一 个 对 应 的 解 。 给 定 S 中 的 一 个 解 , 把 约束 集合 C 
中 除了 xu 之 外 的 所 有 变量 蔡 换 为 它们 在 这 个 解 中 的 实际 取 值 ,， 就 可 以 得 到 xn 的 取 值 范围。 
[证 国 考虑 定义 了 图 11-11 中 的 迭代 空间 的 不 等 式 组 。 假 设 我 们 希望 使 用 Fourier-Motzkin 
消除 算法 来 消除 i 维度, 从 而 把 这 个 二 维 空间 投影 到 j 维度 上 。 存 在 一 个 i 的 下 界 0<i 和 两 个 上 
界 i<j 和 i<5。 这 可 以 生成 两 个 约束 0<j 和 0<5。 后 一 个 约束 是 永 真 式 , 可 以 忽略 。 前 一 个 约 
束 给 出 了 7 的 下 界 ,j 的 上 界 就 是 原来 的 上 界 j<7。 o 

循环 界限 的 生成 

既然 我 们 已 经 定义 了 Fourier-Motzkin HORS UE, 生成 循环 界限 来 遍历 一 个 凸 多 面体 的 算法 
(算法 11. 13 ) 就 很 容易 得 到 了 。 我 们 按照 从 最 内 层 到 最 外 层 循环 的 顺序 计算 循环 界限 。 所 有 水 
及 最 内 层 循环 下 标 变量 的 不 等 式 都 被 改写 成 为 该 变量 的 下 上 界 的 形式 。 然 后 , 我 们 通过 投影 消 
除 代表 了 最 内 层 循环 的 维度 ,得 到 减少 了 一 个 维度 的 多 面体 。 我 们 重复 这 个 过 程 ， 直 到 找 出 所 有 
循环 下 标 变量 的 界限 。 
给 定 一 组 变量 的 顺序 , 计算 这 些 变量 的 界限 。 

输入 : 一 个 在 变量 wm ,mm ，…,o 之 上 的 凸 多 面体 5。 

输出 : 每 个 变量 w 的 下 界 L; 和 上 界 U, 这 些 界限 只 使 用 排 在 y 之 前 的 变量 (7) <1) RER 

方法 : 该 算法 在 图 11-15 中 描述 。 Oo 
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Sy = S: PARE 11.11 来 计算 循环 界限 */ 
for(t=n;i2l;i-~){ 
Ly, = Si 中 vw 的 所 有 下 界 ; 
Uy, = Si Atay 的 所 有 十 界 ; 
Sii = 将 算法 11.11 应 用 于 消除 约束 集 食 5; 中 的 如 后 得 到 
的 约束 集合 ; 


} 
/* 消除 完 余 性 */ 
S =f; 
for (i=1;i<n;i++){ 
消除 所 有 由 9' RAI Ly, 和 U PA SER 
FU Ly, MM Uy, PREF vi 的 约束 加 到 .5 中 。 


} 











图 11-15 ”按照 一 个 给 定 的 变量 顺序 表示 变量 界限 的 代码 


RC 我 们 应 用 算法 11. 13 来 生成 用 于 垂直 扫描 图 11-11 中 的 迭代 室 间 的 循环 界限 。 下 标 
变量 的 顺序 是 j, i。 该 算法 生成 了 如 下 的 界限 : : 





Li:0 
Ui:5, 
Li:0 
U;7 
我 们 要 满足 所 有 这 些 约束 ,因此 i 的 上 界 是 min(5,j) 。 这 个 例子 中 没有 元 余 的 界限 。 [a 


11.3.6 “坐标 轴 的 变换 
请 注意 , 上 面 讨论 的 对 迭代 空间 进行 水 平 扫描 或 垂直 扫描 只 是 两 种 最 常见 的 访问 和 迭代 空间 

的 方法 。 还 有 很 多 其 他 的 可 行 方法 ,比如 , 我 们 可 以 按照 逐条 斜 线 的 方式 来 扫描 例 11. 6 PHE 

代 空 间 。 下 面 的 例 11. 15 就 讨论 这 种 扫描 方法 。 

AE 我 们 可 以 按照 逐条 斜 线 的 方式 来 扫描 图 11-11 中 的 迭代 空间 , 使 用 的 顺序 如 图 11-16 

所 示 。 每 条 斜 线 上 的 点 的 坐标 和 i 之 间 的 差 值 是 一 个 














常量 。 开 始 的 时 候 这 个 差 值 是 0, 而 结束 的 时 候 是 7。 oar a oa a re oa 
因此 , 我 们 定义 一 个 新 的 变量 上 =j -i, 并 按照 针对 大 | fool, La 24}, Bs lol, B7 
的 词典 顺序 来 扫描 上 面 的 迁 代 空间 。 在 不 等 式 中 用 jk | Uo oh Deak gr e7 
ER i, 我 们 得 到 |: 0.5], [1.4], [2,7] 

O<j-k<5 a [1,7] 

J-ksj <7 











要 为 上 面 描述 的 顺序 建立 循环 界限 , 可 以 对 上 面 的 图 11-16 图 11-11 的 迭代 空间 的 斜 向 排序 
不 等 式 集合 按照 变量 顺序 k、j 应 用 算法 11.13, 得 到 
Li:k 
U;:5+k,7 
L0 
U,:7 
根据 这 些 不 等 式 , 我 们 可 以 生成 下 列 代 码 。 在 访问 数组 的 时 候 , i WERN j- ko 
for (k = 0; k <= 7; k++) 


for (j = k; j <= min(5+k,7); j++) 
Z(j,j-k] = 0; 
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一 般 来 说 , 我们 可 以 通过 创建 新 的 循环 下 标 变量 并 定义 这 些 变量 的 顺序 ， 从 而 改变 一 个 多 面 
体 的 坐标 轴 。 这 些 新 的 循环 下 标 变量 表示 了 原来 变量 的 仿 射 组 合 。 这 个 问题 的 难点 在 于 如 何 选 
择 适 当 的 坐标 轴 ,， 使 得 在 满足 数据 依赖 关系 的 同时 达到 并 行 性 和 局 部 性 目标 。 我 们 将 从 11.7 节 
开始 讨论 这 个 问题 。 在 这 里 ， 我们 的 结果 表明 一 旦 选择 好 坐标 轴 ,， 就 可 以 像 例 11. 15 所 示 那 样 直 
接生 成 想 要 的 代码 。 

还 有 很 多 遍历 - 迁 代 的 顺序 不 能 使 用 这 个 技术 处 理 。 比 如 ,我 们 可 能 希望 首先 访问 一 个 迭 
代 空间 中 的 奇数 行 ， 然后 再 访问 其 偶数 行 。 或 者 我 们 可 能 想 从 送 代 空 间 的 中 间 开 始 然后 逐渐 到 
达 边 缘 地 带 。 但 是 , 对 于 具有 仿 射 访问 函数 的 应 用 程序 而 言 , 这 里 描述 的 技术 覆盖 了 人 们 期 望 的 
大 部 分 迭代 排序 。 
11.3.7 11.3 节 的 练习 

练习 11. 3. 1; 把 下 面 的 循环 转换 成 为 另 一 种 形式 ,其 中 循环 下 标 每 次 增加 1 


1) for (i=10; i<50; i=i+7) X[i,i+1] = 0; 





2) for (i= -3; ix=10; i=i+2) X[i] = X[i+1]; 

3) for (i=50; i>=10; i--) X[i] = 0; 

练习 11.3.2: 夯 出 或 描述 下 面 的 每 个 循环 姐 套 结构 的 迭代 空间 : 
1) 图 11-17a PHM RE RMN. 

2) 图 11-17b PTER E A o 

3) 图 11-17c FMRE o 











for (i = 1; i < 30; i++) for (i = 10; i <= 1000; i++) 
for (j = i+2; j < 40-i; j++) for (j = i; j < i+10; j++) 
Xfi,j] = 0; x[i, j] = 0; 


a) 4111.3. ANERE EE b) FRE] 11.3.2(2) ROGER ERY 




















for (i = 0; i < 100; i++) 
for (j = 0; j < 100+i; j++) 
© for (k = itj; k < 100-i-j; k++) 
X{i,j,k] = 0; 








c) 练习 11.3.2(3) 的 循环 媒 套 结构 
图 11-17 练习 11. 3. 2 的 循环 媒 套 结构 


练习 11. 3. 3; 按照 (11.1) 的 形式 写 出 图 11-17 中 的 每 个 循环 柑 套 结构 所 蕴涵 的 约束 。 也 就 
是 给 出 向 量 i 和 bb 以 及 矩阵 了 的 值 。 

练习 11. 3. 4: SIR 11-17 PHS MEA HEARED. 

练习 11.3.5: 使 用 Fourier-Motzkin 消除 算法 从 练习 11.3.3 中 得 到 的 各 个 约束 集合 中 消除 i。 

练习 11. 3. 6: 使 用 Fourier-Motzkin 消除 算法 从 练习 11.3.3 中 得 到 的 各 个 约束 集合 中 消 
除 j。 

练习 11. 3.7: 对 于 图 11-17 PHS MEP REAM, 改写 相应 的 代码 , 使 得 坐标 轴 i IR 
为 主 对 角 线 ， 即 新 的 坐标 轴 可 以 用 i=j 描述 。 新 的 坐标 轴 应 该 对 应 于 最 外 层 循 环 。 

练习 11.3.8: 对 于 下 列 的 坐标 轴 变 换 , 重复 练习 11.3.7: 

1) 将 i 替换 为 i+j, 即 新 的 坐标 轴 的 方向 是 i+j 等 于 常量 的 直线 。 新 的 坐标 轴 对 应 于 最 外 层 
的 循环 。 

2) 将 j 蔡 换 为 i-2。 新 的 坐标 轴 对 应 于 最 外 层 循环 。 
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| 练习 11.3.9: 在 下 列 循环 中 , 令 4.8 和 C 为 常 整数 并 且 C>1,B>4: 
for (i = A; i <= B; i = i +C) 
Z[i] = 0; 


改写 这 个 循环 使 得 该 循环 的 下 标 变量 的 增 量 为 1, 并且 初 值 为 0。 也 就 是 说 ,新 循环 的 形式 如 下 : 
or (j = 0; j <= D; j++) 
i ee + ae 0; i 


其 中 DE 为 整数 。 把 DE、F 表示 为 4、B8、C 的 表达 式 。 
练习 11. 3. 10: 对 于 一 个 通用 的 深度 为 2 的 循环 伐 套 结构 


for (i = 0; i <= A; i++) 
for(j = B¥i+C; j <= D*i+E; j++) 


其 中 4 到 五 是 常 整数 。 以 矩阵 - 向 量 的 形式 , BN Bi + b = 0 HERS ie MEH ie ET ADK fh 
空间 的 约束 。 
练习 11.3.11: 对 于 如 下 的 带 有 整数 符号 常量 m 和 的 通用 的 深度 为 2 的 循环 散 套 结构 


for (i = 0; i <= m; i++) 
for(j = A¥*i+B; j <= C¥#itn; j++) 


重复 练习 11. 3. 10。 和 前 面 一 样 , ABA ( 表示 特定 的 整数 常量 。 只 有 im An 可 以 在 未 知 量 
: 的 向 量 中 出 现 。 另 外 请 记 住 ， 只 有 ;和 7 是 表达 式 的 输出 变量 。 


11.4 仿 射 的 数组 下 标 


本 章 关 注 的 是 仿 射 数组 访问 , 即 每 个 数组 下 标 都 被 表示 为 循环 下 标 和 符号 常量 的 仿 射 表达 
式 。 仿 射 函数 提供 了 从 和 迭代 空间 到 数据 空间 的 简明 的 映射 关系 , 这 使 得 我 们 容易 确定 娜 些 迁 代 
被 映射 到 同一 个 数据 或 同一 个 高 速 缓存 线 。 

就 像 一 个 循环 的 仿 射 上 下 界 可 以 表示 成 一 个 矩阵 - 向 量 的 计算 一 样 , 我 们 可 以 使 用 同样 的 
方法 来 处 理 仿 射 访问 函数 。 只 要 把 仿 射 访问 函数 表示 成 矩阵 - 向 量 的 形式 , 我 们 就 可 以 应 用 标 
准 的 线性 代数 技术 末 寻 找 相关 的 信息 ， 比 如 被 访问 数据 的 维度 以 及 哪些 选 代 指 向 同一 个 数据 。 
11.4.1 仿 射 访问 

如 果 下 列 条 件 成 立 , 我 们 就 说 一 个 循环 中 的 一 个 数组 访问 是 仿 射 的 。 

1) 该 循环 的 上 下 界 被 表示 为 外 围 循环 变量 和 符号 常量 的 仿 射 表 达 式 , H 

2) 该 数组 的 每 个 维度 的 下 标 也 是 外 围 循环 变量 和 符号 常量 的 仿 射 表达 式 。 

Cae 假设 ;和 /7 是 循环 下 标 变量 ,其 上 下 界 通过 仿 射 表达 式 给 出 。 仿 射 数 组 访问 的 例子 
Æ Zli], Z[i+j+1] ,2Z[0], Zli,i]MZ[2*i+1,3 *j-10], Mn 是 一 个 循环 媒 套 结构 中 的 
符号 常量 , 那么 Z[3 * n,n - 门 是 仿 射 数组 访问 的 另 一 个 例子 。 但 是 Z[i * 站 和 2Z[n* 站 不 是 仿 射 
访问 。 口 

每 个 仿 射 数组 访问 可 以 用 两 个 失 阵 和 两 个 向 量 来 描述 。 第 一 个 矩阵 - 向 量 对 是 B 和 4b, 它们 
以 式 (11.1) 中 的 不 等 式 的 方式 描述 了 该 访问 的 迭代 空间 。 我 们 通常 用 已 和 来 表示 第 二 对 拢 
阵 -向 量 对 。 它 们 表示 循环 下 标 变量 的 函数 , 这些 函数 生成 了 在 数组 访问 的 不 同 维度 中 使 用 的 数 
组 下 标 。 

正式 地 说 , 我 们 把 使 用 了 下 标 变量 向 量 i 的 一 个 循环 垦 套 结构 中 的 数组 访问 表示 为 一 个 四 元 
组 .F= <F,f,B,b>; CHRR 








Bi+b>0 
中 的 回 量 i 映射 到 数组 元 素 位 置 
Fi +f 
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il 图 11-18 af — eae OLY FS RS AN SR OR AY EAT. BA Pte i AL 组 成 了 
la] 量 i, 另外 ， x, je 利 Z 分 别 是 是 维度 为 1 2 和 3 的 数组 o 






























































第 一 个 数组 访问 [i-1] 由 一 个 1x2 的 矩阵 正和 数组 访问 仿 射 表达 式 
一 个 长 度 为 1 的 向 量 了 RAR. WHER, MRT | [+ 
Me - 向 量 乘法 并 加 到 中 时 , 我 们 得 到 一 个 函数 i-1。 j 
这 个 函数 就 是 前 面 提 到 的 对 一 维 数组 进行 访问 所 使 <a 
用 的 公式 。 同 时 请 注意 , 第 三 个 访问 Y[j,j+1] 在 进行 ”| Yi,j] 8 ae 
和 矩阵 - ARTE MINI SG, 得 到 一 个 函数 对 (j,j + ae ka ae 
1) 。 它 们 就 是 这 个 二 维 数组 访问 的 下 标 。 TERTI ee 
最 后 , 我 们 观察 第 四 个 数组 访问 Y[1,2]。 这 个 访 | YY o1lljl+li 
问 是 一 个 常量 , BOCK), EF RSE, At, 
循环 下 标的 向 量 i 没 有 出 现在 访问 函数 中 。 LD, i eere 
11.4.2 ”实践 中 的 仿 射 访问 和 非 仿 射 访问 i Sees 
在 数值 计算 程序 中 ,， 有 一 些 常见 的 数据 访问 模式 ee Ae 
不 是 仿 射 的 。 涉 及 稀 朴 矩阵 的 程序 是 一 个 重要 的 例子 。 sa | fi o ; [9] 
血 朴 矩阵 的 常用 表示 方法 之 一 是 只 保存 -- 个 向 量 中 的 2 E 





非 零 元 素 , 并 使 用 辅助 的 下 标 数组 来 记录 某 一 行 从 哪 
里 开始 , 以 及 哪些 列 包含 非 零 元 素 。 访 问 这 样 的 数据 图 11-18 一 些 数组 访问 和 它们 的 

时 要 使 用 间接 数组 访问 。 这 种 类 型 的 访问 ， 比 如 矩阵 -向 量 表 示 

XL YLi]], 是 对 数组 对 的 非 仿 射 访问 。 如 果 和 矩阵 的 稀 朴 情况 是 有 规律 的 ， 比 如 在 一 个 带 状 矩阵 中 
只 有 在 对 角 线 周围 才 有 非 零 元 索 , 那么 可 以 使 用 紧密 数组 来 表示 带 有 非 零 元 素 的 子 区 域 。 在 这 
样 的 情况 下 , 数组 访问 仍 可 能 是 仿 射 的 。 

另 一 个 常见 的 非 仿 射 访问 的 例子 是 线性 化 的 数组 。 程 序 员 有 时 使 用 一 个 线性 数组 来 存放 一 
人 在 正常 情 
况 下 写成 Z[i 门 形式 的 访问 现在 变 成 了 Zien tj], 其 下 标 是 一 个 二 次 函数 。 如 果 对 线性 化 数 
dee Shae E ene ea eae A 
可 以 把 这 个 线性 访问 转换 成 为 一 个 多 维 的 访问 。 最 后 , 如 例 11. 18 所 示 , 我 们 注意 到 可 以 使 用 归 
纳 变量 分 析 把 一 些 非 仿 射 访问 转换 成 为 仿 射 访问 。 

E 我 们 可 以 把 下 面 的 代码 








j=1; 

for (i = 0; i <= n; i++) 1 
Z{j] = 0; 
j = jt2; 


j =n; 

for (i = 0; i <= n; i++) { 
Z{nt+2*i] = 0; 

} 


这 样 做 使 得 这 个 对 矩阵 Z 的 访问 变 成 仿 射 的 。 口 
11.4.3 11.4 节 的 练习 
练习 11. 4. 1: 对 于 下 面 的 每 个 数组 访问 , 给 出 描述 它们 的 向 量 和 和 矩阵 正 。 假 设 下 标 向 量 ; 
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是 i,j,…, FF AST HITER FERRADA ER. 
1) X[2#i+3,2 *j-i] 
2) ¥Y[i-j,j-k, k-i] 
3) Z[3,2*j, k-2*i+1] 


11.5 数据 复 用 


从 数组 访问 函数 中 我 们 得 到 了 两 种 可 用 于 局 部 性 优化 和 并 行 化 的 有 用 信息 : 

1) 数据 复 用 ; 对 于 局 部 性 优化 , 我 们 希望 识别 出 访问 相同 数据 或 相同 高 速 缓存 线 的 选 代 
集合 。 

2) 数据 依赖 : 为 了 并 行 化 和 局 部 性 循环 转换 的 正确 性 , 我 们 希望 找 出 代码 中 的 所 有 数据 依 
赖 关系 。 回 顾 一 下 , 如 果 两 个 (不 一 定 不 同 的 ) 访 问 的 实例 可 能 指向 相同 的 内 存 位 置 , 并 且 其 中 
至 少 有 一 个 是 写 运算 , 那么 这 两 个 访问 之 间 具 有 数据 依赖 关系 。 

在 很 多 情况 下 ,只 要 我 们 找到 了 复 用 相同 数据 的 迭代 ,就 知道 它们 之 间 必 然 存在 数据 依赖 
关系 。 

只 要 存在 数据 依赖 关系 ,显然 就 会 有 相同 的 数据 被 复 用 。 比 如 , 在 矩阵 乘法 中 , 输出 数组 中 
的 同一 个 元 素 被 写 0(n) 次 。 这 些 写 运算 必须 按照 原来 的 顺序 执行 虽 , 我 们 可 以 分 配 一 个 寄存 器 ， 
令 它 在 计算 输出 数组 的 一 个 元 素 时 存放 该 元 素 。 这 个 就 可 以 利用 这 个 数据 复 用 机 会 。 

不 过 , 并 不 是 所 有 的 数据 复 用 都 可 以 用 到 局 部 性 优化 中 , 下 面 的 例子 说 明了 这 个 问题 。 
Oil 11. 19 考 虑 下 面 的 循环 : 


for (i = 0; i < n; i++) 
Z[7+i+3] = Z[3*i+5]; 


我 们 观察 到 这 个 循环 在 每 次 迭代 时 都 对 不 同 的 内 存 位 置 进行 写 运算 , 因此 在 不 同 的 写 操作 
之 间 没 有 复 用 或 者 依赖 关系 。 但 是 , 这 个 循环 从 位 置 5.8、11、14、17、…: 读 取 数 据 , 而 向 位 置 3、 
10,17 .24… 写 人 数据 。 不 同和 迭代 的 读 运算 和 写 运 算 访问 了 共同 的 元 素 17,38 和 59…。 也 就 是 说 ， 
对 于 j=0,1,2,…, 形 如 17 +21j(j=0,1,2,…) 的 整数 就 是 所 有 了 既 可 以 写作 7ii +3, 又 可 以 写作 
3i, +5 的 整数 , Hi in 是 两 个 整数 。 但 是 这 种 复 用 很 少 发 生 , 因此 即使 有 可 能 利用 这 种 复 用 ， 
也 不 容易 做 到 。 o 

数据 依赖 和 复 用 分 析 的 不 同 之 处 在 于 : 具有 数据 依赖 关系 的 访问 中 必须 有 一 个 访问 是 写 访 
问 。 更 重要 的 是 , 数据 依赖 关系 必须 既 正 确 又 精确 。 为 了 保持 正确 性 , 它 必须 找到 所 有 的 依赖 关 
Feo (LH, 它 又 不 应 该 找 出 假 的 依赖 关系 ， 因 为 这 些 假 依 赖 关 系 会 引起 不 必要 的 串 行 执行 。 

考虑 数据 复 用 时 , 我 们 只 需要 找 出 大 部 分 可 利用 的 复 用 在 哪里 。 这 个 问题 就 简单 多 了 ， 因此 我 
们 在 本 节 中 就 讨论 这 个 主题 , 接 下 来 再 讨论 数据 依赖 问题 。 因 为 循环 界限 很 少 改变 复 用 区 域 的 形 
状 , 所 以 可 以 通过 忽视 循环 界限 来 简化 对 复 用 的 分 析 。 可 以 被 仿 射 分 划 利 用 的 很 多 数据 复 用 位 于 相 
同 数组 访问 的 不 同 实 例 之 间 ， 以 及 使 用 相同 的 系数 矩阵 ( 即 在 仿 射 下 标 函 数 中 通常 被 称 为 F RIE 
阵 ) 的 访问 之 间 。 上 面 介绍 过 , 像 7i+3 和 3i+5 这 样 的 访问 模式 没有 令 人 感 兴趣 的 复 用 。 
11.5.1 数据 复 用 的 类 型 

我 们 首先 用 例 11. 20 来 说 明 不 同 种 类 的 数据 复 用 。 在 下 面 的 内 容 中 , 我 们 需要 区 分 作为 程序 








O 这 里 有 一 个 微妙 之 处 。 根 据 加 法 的 交换 率 , 不 管 我 们 按照 什么 顺序 执行 加 法 ， 我 们 依然 得 到 相同 的 结果 。 但 是 ， 
这 种 情况 是 很 特别 的 。 一 般 来 说 , 让 编译 器 来 决定 在 一 个 写 运 算 之 前 的 一 系列 算术 运算 步 又 完成 哪些 计算 过 于 复 
杂 。 我 们 也 不 能 依赖 于 会 有 任何 代数 规则 来 帮助 我 们 安全 地 重新 排列 这 些 步骤 。 
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中 的 一 个 指令 的 访问 (比如 x=2[i, 趾 ) 和 我 们 执行 循环 艇 套 结构 时 指令 的 多 次 执行 。 为 了 强调 
它们 之 间 的 区 别 , 我 们 将 把 访问 指令 本 身 称 为 静态 访问 (static access) ， 而 当 我 们 执行 该 循环 花 套 
结构 时 该 语句 的 多 次 迭代 称 为 动态 访问 (dynamic access) 。 

数据 复 用 可 以 分 为 自 复 用 和 组 复 用 两 种 。 如 果 复 用 同样 数据 的 多 个 迭代 源 于 同一 个 静态 访 
问 , 我 们 就 把 这 样 的 复 用 称 为 自 复 用 ; 如 果 它 们 源 于 不 同 的 静态 访问 , 那么 我 们 称 这 个 复 用 为 组 
复 用 。 如 果 一 个 复 用 指向 完全 相同 的 位 置 , 那么 它 就 是 时 间 复 用 ; 如 果 指 向 同一 个 高 速 缓存 线 ， 
那么 它 就 是 空间 复 用 。 
6 11. 考点 下 面 的 循环 说 套 结 构 : 

float Zrn] ; 

for (i = 0; i < n; i++) 

for (j = 0; j < n; j++) 
Z[j+1] = (Z[j] + Z[j+1] + Z[j+2])/3; 

数组 访问 Z[ 门 .Z[j+1]j 和 2[j+2] 都 具有 自 空间 复 用 性 , AAR TiN ERIE MES 
的 数组 元 素 。 我 们 假定 连续 元 素 很 可 能 存放 在 同一 个 高 速 缓存 线 中 。 另 外 , 这 些 访问 都 具有 自 
时 间 复 用 性 ,因为 在 外 层 循环 的 每 次 迭代 中 , 同一 个 元 素 被 多 次 使 用 。 再 者 , 它们 都 具有 同样 的 
系数 矩阵 , 因此 具有 组 复 用 性 。 在 不 同 的 访问 之 间 具 有 组 复 用 性 , 而 有 旦 既是 时 间 性 复 用 , 又 是 空 
间 性 复 用 。 当 这 些 复 用 都 可 以 利用 时 , 虽然 在 代码 中 有 4n? 次 访问 , 我 们 只 需要 把 大 约 ne 个 高 
速 缓存 线 加 载 到 高 速 缓存 中 即 可 ,其 中 。 是 一 个 高 速 缓存 线 中 的 内 存 字 的 数量 。 因 为 具有 自 空间 
复 用 性 , 我 们 从 4n? 中 消除 了 一 个 因子 n; 因为 存在 空间 局 部 性 , 我 们 又 把 加 载 次 数 隆 低 了 e 倍 ; 
最 后 因为 组 复 用 的 原因 又 降低 了 4 倍 。 口 

下 面 我 们 说 明 如 何 使 用 线性 代数 从 仿 射 数组 访问 中 抽取 复 用 信息 。 我 们 感 兴趣 的 不 仅仅 是 
找 出 有 多 大 的 提高 性 能 的 潜力 , 而 且 要 找 出 哪些 从 代 在 复 用 数据 ,以 便 把 这 些 迭 代 移 近 从 而 利用 
这 些 复 用 。 
11.5.2 BSA 

通过 利用 自 复 用 可 以 有 效 节约 在 内 存 访问 方面 的 开销 。 如 果 一 个 静态 访问 所 指向 的 数据 具 
有 天 个 维度 , 且 这 个 访问 租 套 在 一 个 深度 为 d d> k) 的 循环 结构 中 , 那么 同一 个 数据 可 以 被 复 用 
na 次。 其 中 , n 是 每 个 循环 的 迭代 次 数 。 比 如 ,如 果 一 个 深度 为 3 的 循环 府 套 结构 访问 一 个 数 
组 的 某 一 列 , 那么 访问 节约 系数 就 可 能 达到 驴 。 实 际 上 , 一 个 访问 的 维度 和 这 个 访问 的 系数 矩阵 
的 秩 相对 应 。 我 们 可 以 通过 寻找 该 矩阵 的 零 空间 来 找 出 哪些 先 代 指向 同一 个 位 置 。 具 体 方法 在 
下 面 解释 。 

矩阵 的 秩 

Fae F 的 秩 是 下 的 线性 无 关 列 (或 者 等 价 地 , 行 ) 的 最 大 数目 。 一 个 向 量 集合 被 称 为 线性 无 
关 (linearly independent ) 的 条 件 是 没有 向 量 可 以 被 写成 该 集合 中 有 限 多 个 其 他 向 量 的 线性 组 合 。 


考虑 矩阵 





Rue 


2s 3 
7 9 
5 6 
2 1 0 
请 注意 , 第 二 行 是 第 一 和 第 三 行 的 和 , 而 第 四 行 是 第 三 行 减 去 第 一 行 的 两 倍 。 但 是 , 第 一 行 
和 第 三 行 是 线性 独立 的 ; 其 中 的 任何 一 行 都 不 是 另 一 行 的 倍数 。 因 此 , 矩阵 的 秩 是 2。 
我 们 也 可 以 通过 检查 各 列 来 得 到 这 个 结果 。 第 三 列 是 第 二 列 的 两 倍 减 去 第 一 列 。 另 一 方面 ， 
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任何 两 列 都 是 线性 独立 的 。 我 们 同样 可 以 确定 矩阵 的 秩 为 2。 o 

我 们 看 一 下 图 11-18 中 的 数组 访问 。 第 一 个 访问 X[i - 1] 的 维度 为 1, 因为 矩阵 

[1 0] 的 秩 为 1。 也 就 是 说 , 唯一 的 一 行 是 线性 独立 的 ， 同 样 第 一 列 也 是 线性 独立 的 。 
第 二 个 访问 Y[i,j] 的 维度 为 2。 原 因 是 矩阵 


le 


具有 两 个 独立 的 行 (当然 , 因此 也 具有 两 个 独立 的 列 ) 。 
第 三 个 访问 YLj,j+1] 的 维度 为 1, 因为 矩阵 
0 1 
lo al 
的 秩 为 1。 请 注意 , 矩阵 中 的 两 行 是 相同 的 , 因此 只 有 一 行 是 线性 独立 的 。 等 价 地 , 第 一 列 是 第 
二 列 乘 以 0, 因此 这 两 列 不 是 独立 的 。 直 观 地 讲 , 在 一 个 大 的 正方 形 数组 了 上 中, 所 有 被 访问 的 元 
素 都 排列 在 紧 靠 主 对 角 线 之 上 的 一 条 斜 线 上 。 

第 四 个 访问 Y[1,2] 的 维度 为 0, 因为 一 个 全 零 矩 阵 的 秩 为 0。 请 注意 , 对 于 这 样 的 一 个 和 天 
E, 我 们 找 不 出 非 零 的 矩阵 的 行 (哪怕 只 有 一 行 ) 的 线性 和 。 最 后 一 个 访问 Z[i,i,2 s i +7] ERE 
为 2。 请 注意 在 这 个 访问 的 矩阵 

0 0 
ot 
2 1 


H, 最 后 两 行 是 线性 独立 的 ,任何 一 行 都 不 是 另 一 行 的 倍数 。 但 是 , 第 一 行 是 另 两 行 的 线性 
“A”, 其 中 的 系数 都 是 0。 Oo 

和 矩阵 的 零 空 间 

在 一 个 深度 为 a 的 循环 嵌 套 结构 中 的 秩 为 r 的 数据 引用 在 0(ns) 个 迭代 中 访问 了 0(m) 个 数 
据 元 素 ， 因 此 平均 一 定 有 0 (nz -7) 个 选 代 指 向 同一 个 数组 元 素 。 哪 些 迭 代 访 问 了 同一 个 数据 呢 ? 
假设 在 这 个 循环 嵌 套 结构 中 的 一 个 访问 用 尺 和 j 的 矩阵 -向 量 组 合 来 表示 。 令 i 和 让 为 指向 同一 
个 数组 元 素 的 两 个 迭代 , 那么 Fi+f= Fi' +f。 重 新 排列 这 个 等 式 中 的 各 项 , 我 们 得 到 

F(i-i') =0 

有 一 个 众所周知 的 线性 代数 概念 可 以 刻 划 i 和 i 在 什么 时 候 满 足 上 述 等 式 。 满 足 等 式 Fy =0 的 
所 有 人 解 的 集合 称 为 F 的 零 空 间 。 因 此 ,如 果 两 个 迭代 的 循环 下 标 向 量 的 差 属于 和 矩阵 的 零 空间 ， 
那么 它们 指向 同一 个 数组 元 素 。 

显然 , 零 向 量 v =0 总 是 满足 Fv =0。 也 就 是 说 , 如 果 两 个 向 量 的 差 为 0, 那么 它们 一 定 指向 同 
一 个 数组 元 素 。 换 句 话 说 , 如果 它们 实际 上 是 同一 个 迭代 , 它们 就 指向 同一 个 元 素 。 另 外 , 零 空间 
确实 是 一 个 向 量 空间 。 也 就 是 说 , 如 果 Fy, =0 H Fy, =0, IRA Fv, +v,) =0 A F(ev,) =0, 

如 果 和 矩阵 下 是 全 秩 的 (fully ranked), 也 就 是 说 它 的 秩 为 d, 那么 下 的 零 空间 只 包含 零 向 量 。 
在 这 种 情况 下 , 一 个 循环 骨 套 的 各 个 迭代 指向 不 同 的 数据 。 一 般 来 说 ， 零 空间 的 维度 ， 或 者 说 零 
数 (nullity), RÆ d-ro WE d >r, 那么 对 于 每 个 元 素 , 访问 该 元 素 的 迭代 组 成 一 个 (d -r) 维 
空间 。 

零 空 间 可 以 用 它 的 基本 向 量 表 示 。 一 个 维 的 零 空 间 可 以 由 个 独立 的 向 量 表示 , 任何 可 以 
被 表示 为 这 些 基 本 向 量 的 线性 组 合 的 向 量 都 属于 这 个 空间 。 














重新 考虑 例 11.21 HORE 


rl 2 3 
5 7 9 
4 5 6 
2 1 0 

在 例 11. 21 中 , 我 们 确定 这 个 和 矩 阵 的 秩 为 2, 因此 其 零 数 为 3-2 =1。 在 这 个 例子 中 , 零 空 间 的 基 


本 向 量 必然 是 一 个 长 度 为 3 的 非 零 向 量 。 为 了 找到 这 个 零 空间 的 基本 向 量 , 我 们 假设 零 空 间 中 的 
一 个 向 量 为 [*,y,z] ,并 尝试 求解 下 面 的 方程 


1 2 3 
5 7 9 
: 5 6 
2 1 
如 果 我 们 将 前 面 两 行 乘 以 未 知 向 量 ， 就 得 到 两 个 方程 

x+2y+3z = 0 

5x+7y+9z = 0 

我 们 也 可 以 根据 第 三 和 第 四 行 写 出 这 样 的 方程 , 但 是 因为 不 存在 三 个 线性 独立 的 行 , 所 以 增 
加 方程 不 会 对 xy 和 z 增加 新 的 约束 。 比 如 , 我 们 从 第 三 行 得 到 的 方程 4x + Sy + 6z =0 就 是 通过 
从 第 二 个 方程 中 减 去 第 一 个 方程 得 到 的 。 

我 们 必须 尽 可 能 地 从 上 面 的 等 式 中 消除 变量 。 首 先 使 用 第 一 个 方程 求解 *, 得 到 * = -2y - 
3z。 然 后 在 第 二 个 方程 中 蔡 换 *, 得 到 -3y =6z, 即 y= -2z。 由 x= -2y-3z 且 y= -2z 可 知 x= 
zo AE, 变量 [x,y,z] 实 际 上 是 [z, -2z,z]。 我 们 可 以 选择 任意 的 非 零 z 值 , 得 到 这 个 零 空 间 的 
唯一 基本 向 量 。 比 如 , 我 们 可 以 选择 z=1 并 把 [1, -2,1] 当 作 这 个 零 空 间 的 基本 向 量 。 
Cee 例 11.17 中 的 所 有 数组 访问 的 秩 、 零 数 和 零 空间 显示 在 图 11-19 中 , 请 注意 , 在 所 有 
情况 下 秩 和 零 数 的 和 都 等 于 该 循环 嵌 套 的 深度 2。 因为 数组 访问 Y[i, 站 和 2Z[1,i,2 «i +; RB 
是 2， 因 此 所 有 的 迭代 都 指向 不 同 的 位 置 。 



























































os ae ih 零 空间 的 
访问 仿 射 表达 式 秩 EBL 基本 向 量 
i 0 
X[i-1] [1 oji f+] 1 1 e 
Yi BE : 2 0 
a To 1jfi [o] 1 
YEj,j+1] 0 ilil 1 | 1 1 i 
[To O]f i [1] 1 0 
YE1 ,2] lo a | alee 0 2 Re 
A al bea [1 
Z[1 ,i,2*i+j] 1 0 | 0 2 0 
21|.?1 [o0 
































图 11-19 仿 射 访问 的 秩 和 和 零 数 
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数组 访问 XI 和 下 六)+1] 的 矩阵 的 秩 都 是 1, 因此 O(n) HERRERA, ZEB 
一 种 情况 下 , 迭代 室 间 的 一 整 行 都 指向 同一 个 位 置 。 换 句 话说 ,仅仅 7 值 不 同 的 所 有 迭代 指向 同 
一 个 位 置 。 这 一 事实 由 相应 零 空 间 的 基本 向 量 [0,1] 明 确 表示 。 对 于 了 [7j+ 1]， 和 迭代 空间 中 的 
整 列 指向 同一 个 位 置 。 这 个 事实 由 相应 零 空 间 的 基本 向 量 [1 ,0] 明 确 表 示 。 

最 后 ， 数 组 访问 开 1,2] 在 所 有 和 迭代 中 指向 同一 个 位 置 。 相 应 的 零 空 间 有 两 个 基本 向 量 [ 0， 
1] 和 [1,0], 这 表示 这 个 循环 谋 套 中 的 任何 一 对 迭代 都 准确 地 指向 同一 个 位 置 。 口 
11.5.3 自 空间 复 用 

空间 复 用 的 分 析 依赖 于 矩阵 的 数据 布局 。C 语言 的 矩阵 是 按 行 存放 的 ， 而 Fortran 语言 的 矩 
阵 按 列 存放 。 换 句 话说 , 在 CIR Bp Bee Xi, 站 和 X[i,j+1] 相 邻 ， 而 在 Fortran 语言 中 
Xli j) 和 X[i+1, 门 相 邻 。 不 失 一 般 性 , 在 本 章 余 下 的 部 分 , 我 们 将 选用 C 语言 的 数组 布局 方式 
( 按 行 存放 方式 ) 。 

首先 作出 如 下 的 近似 ， 当 且 仅 当 两 个 数组 元 素 位 于 一 个 二 维 数组 的 同一 行 中 时 ,我们 认为 它 
们 共享 一 个 高 速 缓存 线 。 更 加 一 般 地 讲 , 在 一 个 d 维 数组 中 , 如 果 两 个 元 素 只 在 最 后 一 维 的 下 标 
(LAMAR, 我 们 就 认为 它们 共享 一 个 高 速 缓存 线 。 因 为 对 于 通常 的 数组 和 高 速 缓存 线 ， 多 个 
数组 元 素 可 以 被 放 到 同一 高 速 缓存 线 中 , 以 整 行 的 方式 顺序 访问 一 个 数组 可 以 明显 提高 访问 速 
E. BRR, 我 们 有 时 还 需要 等 待 加 载 一 个 新 的 高 速 缓存 线 。 

发 现 和 利用 自 空 间 复 用 的 技巧 是 不 考虑 系数 矩阵 中 的 最 后 一 行 。 如 果 得 到 的 截 短 后 的 矩 
阵 的 秩 小 于 循环 撕 套 结构 的 深度 , 那么 我 们 就 可 以 确保 最 内 层 循 环 只 改变 数组 的 最 后 下 标的 值 ， 
从 而 保证 空间 局 部 性 。 

A A 考虑 图 11-19 中 的 最 后 一 个 数组 访问 Z[1,i,2 * + 门 。 如 果 我 们 删除 最 后 一 行 ,， 就 
会 得 到 下 面 的 截 短 后 的 矩阵 

0 0 

[| 


这 个 抢 阵 的 秩 显然 是 1。 因为 该 循环 伐 套 结构 的 深度 为 2, 所 以 存在 空间 复 用 的 机 会 。 在 这 
个 例子 中 , 因为 了 是 内 层 循环 的 下 标 旦 Z 是 按 行 存放 的 , 所 以 内 层 循环 访问 Z 的 连续 元 素 。 让 i 
成 为 内 层 循环 的 下 标 不 会 产生 空间 局 部 性 。 因 为 当 ; 改变 时 , 第 二 和 第 三 个 维度 都 会 改变 。 OF 

确定 是 否 存 在 自 空间 复 用 的 一 般 规则 如 下 。 如 我 们 一 直 所 做 的 , 假设 各 循环 的 下 标 和 系数 
矩阵 的 各 列 顺 序 对 应 ,其 中 最 外 层 循环 对 应 于 第 一 列 , 最 内 层 循环 对 应 于 最 后 一 列 。 然 后 , 为 了 
确保 存在 空间 复 用 , 向 量 [0,0,…,0,1] 必 须 在 被 截 短 的 矩阵 的 零 空 间 中 。 理 由 是 如 果 这 个 向 量 
在 零 空间 中 , 那么 当 我 们 把 除了 最 内 层 下 标 之 外 的 所 有 下 标 都 固定 下 来 的 时 候 , 就 知道 在 最 内 层 
循环 的 一 次 执行 中 所 有 的 动态 访问 都 只 在 最 后 的 数组 下 标 上 取 不 同 的 值 。 如 果 数 组 是 按 行 存放 
的 , 那么 这 些 元 素 之 间距 离 接 近 , 有 可 能 在 同一 高 速 缓 存 线 中 。 

AEZ 请 注意 , [0,1]( 转 置 为 一 个 列 向 量 ) 位 于 例 11. 25 中 的 被 截 短 矩阵 的 零 空 间 中 。 因 
此 , 我 们 期 望 当 把 7 当 作 内 层 循环 下 标 时 会 出 现 空间 局 部 性 。 男 一 方面 ， 如 果 我 们 颠倒 循环 的 顺 
序 使 得 i 成 为 内 层 循环 , 那么 系数 和 矩阵 就 变 成 


ae 


ME, [0,1] 就 不 在 这 个 矩阵 的 零 空 间 中 了 。 相 反 地 , 零 空 间 由 基本 向 量 [1,0] 生 成 。 因 此 ,如 
我 们 在 例 11. 25 中 所 建议 的 , 如 果 ;是 内 层 循环 , 我 们 不 再 期 望 这 个 循环 只 有 空间 局 部 性 。 
但 是 , 我 们 应 该 观察 到 向 量 [0,0,…:;0,1] 在 零 空 间 里 远 不 足以 保证 空间 局 部 性 。 比 如 , 假设 
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该 访问 不 是 Z[1,i,2 itj] ME Z[1,1,2 *1+50%j], MARARRUN KEZIT, 2Z 的 每 50 
个 元 素 只 有 一 个 元 素 会 被 访问 , 除非 一 个 高 速 缓存 线 长 到 足以 保存 50 个 以 上 的 元 素 , 否则 我 们 
将 无 法 复 用 一 个 高 速 缓存 线 。 g 
11.5.4 组 复 用 

我 们 只 在 同一 个 循环 中 的 具有 相同 系数 矩阵 的 数组 访问 之 间 计 算 组 复 用 。 给 定 两 个 动态 访 
la] Fi, +f, 和 Fi, tf, 它们 复 用 相同 的 数据 的 条 件 是 

Fi, +f =Fi, +f 
或 者 说 
F(i -i,) =( fo -fi) 

假设 ”是 这 个 等 式 的 一 个 解 , 如 果 w 是 五 的 零 空 间 中 的 任意 向 量 , 那么 w +v 也 是 一 个 解 。 实 际 
上 ,这样 的 向 量 就 是 该 方程 的 全 部 解 。 
| 下 面 的 深度 为 2 的 循环 撕 套 结构 

for (i = 1; i <= n; i++) 


for (j = 1; j <= n; j++) 
Z[i, j} = 2(i-1,3]; 


有 两 个 数组 访问 Zi) Z(i-1 jlo EER, 这 两 个 访问 都 可 以 使 用 系数 矩阵 


en 


来 刻 划 。 这 个 矩阵 和 图 11-19 中 的 第 二 个 访问 Yi j] AE. ER 2, 因此 没有 
自 时 间 复 用 。 

但 是 , 每 个 访问 都 展示 了 自 空间 复 用 。 如 11. 5.3 节 中 所 述 ， 当 我 们 删除 该 矩阵 的 最 下 面 一 
行 后 , 只 留 下 最 上 面 的 一 行 [1,0], 其 秩 为 1。 因 为 [0,1] 位 于 这 个 被 截 短 矩阵 的 零 空 间 中 ,所 以 
我 们 期 望 找到 空间 复 用 。 内 层 循 环 下 标 j 的 每 次 增加 都 会 把 第 二 个 下 标的 值 增加 1, 实际 上 确实 
访问 了 连续 的 数组 元 素 , 并 将 充分 利用 每 个 高 速 缓存 线 。 

虽然 两 个 访问 都 没有 自 时 间 复 用 性 , 请 注意 这 两 个 访问 Z[i,j] 和 2Z[i -1, 站 所 访问 的 几乎 是 
同一 个 集合 的 数组 元 素 。 也 就 是 说 , 除了 i=1 的 情况 之 外 , 数组 访问 Z[i- 1, 站 所 读 取 的 数据 和 
数组 访问 Z[i, 站 所 写 人 的 数据 相同 , 因此 它们 之 间 存 在 组 时 间 复 用 。 这 个 简单 的 访问 模式 对 于 
整个 迭代 空间 都 成 立 , 可 以 利用 这 个 模式 来 提高 代码 的 数据 局 部 性 。 正 式 地 讲 ， 如 果 不 考 虑 循环 


界限 , 那么 只 要 

1 Op? 0 1 Ori = 

bb i lHkh ee 
成 立 , 分 别 位 于 近代 (i JOERG h) PROS RA ll Z[i, 站 和 2Z[i-1, 门 指向 同一 个 位 
置 。 改 写 这 些 项 , 我 们 得 到 








也 就 是 说 , j =h Hin =i, +1. 

请 注意 , 这 个 复 用 是 沿 着 迭代 空间 的 i 轴 发 生 的 。 也 就 是 说 , 适 代 (i; yj) FETE IRC, i) RAE 
之 后 的 n 次 (内 层 循环 的 ) 和 迭代 之 后 才 发 生 。 因 此 , 在 被 写 人 数据 被 复 用 之 前 要 执行 很 多 个 和 迭代 。 
此 时 这 个 数据 有 可 能 在 (也 有 可 能 不 在 ) 高 速 缓 存 中 了 。 如 果 高 速 缓存 中 存放 了 和 矩 阵 Z 的 连续 两 
ÍT, 那么 数组 访问 Z[i -1, 门 不 会 发 和 高速 绥 存 脱 靶 现 象 ,， 整个 循环 嵌 套 结构 的 总 的 高 速 缓存 脱 
WR n/c, 其 中 是 每 个 高 速 缓存 线 中 的 元 素数 量 。 否 则 , 脱 靶 次 数 将 会 为 原来 的 两 倍 , A 
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为 这 两 个 静态 访问 对 于 每 “个 动态 访问 都 要 求 加 载 一 个 新 的 高 速 缓存 线 。 
AD E 假设 在 一 个 深度 为 3 HERRER PAAA ALi j ij] a Alij tals 
TARE API FRASE RDE iko 那么 对 于 两 个 访问 所 = ty ky lA i = Ly, j,k], 


只 要 
1 0 Of 4 0 1 0 O42 1 
1 1 OdLk, 0 1 1 odli 0 
RZ, 它们 就 能 复 用 同一 个 数组 元 素 。 


这 个 方程 成 立时 , TBE v= [i -i -jak — ky PRA = [1,，-1,0j。 也 就 是 说 
= +l, ji 5-1 H k =k 9 然而 , 矩阵 


1 0 0 
ok 1 | 
1 1 0 


的 零 空间 是 由 基本 向 量 [0,0,1] 生 成 的 。 也 就 是 说 , 第 三 个 循环 下 标 上 可 以 是 任意 值 。 因 此 ,上 
面 方程 的 解 » 可 以 是 [1, -1,m], 其 中 m 为 任意 值 。 换 名 话说 ,在 一 个 下 标 为 iy. 的 循环 媒 套 
结构 中 ,4[i,j,i+ 让 的 一 个 动态 访问 不 仅 被 4A[i,j,i + 门 的 具有 同样 i 值 和 不 同上 值 的 其 他 动态 
访问 所 复 用 , 也 被 4[i+ 1 - 1,i+ 门 的 其 循环 下 标 值 为 !+1、j -1 和 任意 上 值 的 动态 访问 所 
复 用 。 o 

我 们 可 以 用 类 似 的 方法 来 考虑 组 空间 复 用 , 虽然 不 会 在 这 里 这 么 做 。 和 针对 自 空间 复 用 的 
讨论 一 样 , 我 们 只 需要 舍弃 被 考虑 矩阵 的 最 后 一 维 就 可 以 了 。 

对 于 不 同 种 类 的 复 用 , 复 用 的 程度 是 不 同 的 。 自 时 间 复 用 的 好 处 最 多 : 一 个 具有 上 维 零 空间 
的 数组 访问 对 同一 个 数据 会 复 用 Ot) 次 。 自 空间 复 用 的 程度 受到 高 速 缓存 线 长 度 的 限制 。 最 
后 ,组 复 用 的 程度 受 一 个 组 中 共享 该 复 用 的 数组 访问 数目 的 限制 。 
11.5.5 11.5 节 的 练习 

练习 11. 5.1: 计算 图 11-20 中 各 个 矩阵 的 秩 。 并 给 出 每 个 矩阵 的 最 大 线性 独立 列 的 集合 , 以 
及 最 大 的 线性 独立 行 的 集合 。 
































0 1 3 1 2 3 4 0 0 1 
练习 11.5.2: 找 出 图 11-20 中 各 个 矩阵 的 零 | 1 2 | 56 7 8 0 1 | 
xÀ 237 9 10 12 15 Li 
空间 的 基本 向 量 。 ar ae a ee cae a 5 6 3 
练习 11. 5. 3: 假设 - | 个 迭代 空 间 的 维度 ( 变 a) b) c) 
量 ) 为 ij 和 kk。 对 于 下 面 的 每 个 访问 , 描述 指 问 下 
列 数组 元 素 的 子 空间 : E1120 计算 这 些 矩阵 的 秩 和 零 空 间 











1) Ali, j,i +j] 
2) A[i,i+1,i+2] 
13) Alii, j+k] 





© 在 这 里 可 以 观察 到 一- 件 很 有 意思 的 事情 。 虽 然 这 个 例子 有 一 个 解 , 但 如 果 我 们 把 第 三 个 分 基 : AR +, 解 
就 不 存在 了 。 也 就 是 说 , 在 这 个 给 定 的 例子 中 , 两 个 访问 所 触及 的 数组 元 娄 都 存在 于 一 个 二 维 的 子 空间 $ 中 。 该 
空间 可 以 定义 为 “第 三 个 分 县 是 前 面 两 个 分 捞 的 和 ”。 如 时 我 们 把 tj Bea i j+, 则 第 三 个 访问 所 触及 的 元 素 

都 不 在 $ 中 , 因此 也 不 存在 任何 复 用 。 
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14) Afi-j,j-k,k-i] 
1 练习 11.5.4: 假设 数组 4 按 行 存 放 , SEAR PB EH PT 
for (i = 0; i < 100; i++) 
for (j = 0; j < 100; j++) 
for (k = 0; k < 100; k++) 
< 基 个 对 的 访问 > 


对 于 下 列 的 各 个 访问 , 指出 是 否 可 能 改写 该 循环 结构 ,使 得 对 4 的 访问 具有 自 空间 复 用 特 
性 。 也 就 是 说 , 整个 高 速 缓 存 线 被 连续 使 用 。 如 果 可 以 , 指明 如 何 改 写 这 个 人 循环。 注意, 对 循环 
的 改写 可 以 包括 对 下 标 变量 重新 排序 或 引入 新 的 循环 下 标 。 但 是 不 能 改变 数组 的 布局 ,比如 把 
数组 改 成 按 列 存放 的 。 还 要 注意 的 是 ,一 般 来 说 ,循环 下 标的 重新 排序 可 能 是 合法 的 , 也 可 能 是 
非法 的 。 我 们 将 在 下 一 节 给 出 判断 重新 排序 是 否 合 法 的 标准 。 但 是 在 这 个 例子 中 , 因为 每 个 访 
问 的 效果 就 是 把 一 个 数组 元 素 设置 为 0, 所 以 不 需要 担心 循环 重新 排列 的 效果 会 影响 程序 的 
语义 。 

1) A[i+1,i+k,j] =0 

112) A[j +k,i,i] = 0 

3) Afi,j,k,i+3+k] = 0, 

I! 4) A[i,j -k,i+j,i+k] = 0 

练习 11. 5.5: 在 11.5.3 节 中 ,我 们 说 如 果 最 内 层 循环 只 改变 一 个 数组 访问 的 最 后 一 个 下 标 
(A, 我 们 就 能 获得 空间 局 部 性 。 但 是 这 个 断言 依赖 于 : 数组 是 按 行 存放 的 假设 。 如 果 数 组 是 按 列 
存放 的 , 那么 什么 样 的 条 件 可 以 保证 空间 局 部 性 ? 

| 练习 11.5.6: 在 例 11.28 中 , 我 们 看 到 两 个 相似 的 数组 访问 之 间 是 否 存 在 复 用 很 大 程度 
上 依赖 于 特定 的 数组 下 标 表达 式 。 将 在 例 11. 28 中 观察 到 的 事实 进行 推广 ,并 决定 对 什么 样 的 函 
数 J(i, 站 ,访问 4[i,j,i+ 有 和 A[i+1,j-1,f(i,j)] 之 间 存 在 复 用 。 

| 练习 11.5.7; 在 例 11.27 中 , RH, WREE Z 的 行 的 长 度 很 长 , 以 至 于 不 能 一 起 存 
放 到 高 速 缓存 中 ,就 会 产生 更 多 的 不 必要 的 高 速 缓存 脱 靶 。 如 果 出 现 了 这 样 的 情况 , 应 怎样 改写 
循环 嵌 套 以 保证 纽 空间 复 用 ? 


11.6 数组 数据 依赖 关系 分 析 


并 行 化 或 局 部 性 优化 经 常 对 原 程序 中 执行 的 运算 重新 排序 。 和 所 有 的 优化 一 样 ， 只 有 当 对 
运算 的 重新 排序 不 会 改变 程序 输出 时 才 可 以 对 这 些 运算 重新 排序 。-- 般 来 说 , 我 们 不 可 能 深入 
理解 一 个 程序 到 底 做 了 什么 , 代码 优化 通常 选用 一 个 较 简 单 的 .保守 的 测试 方法 来 决定 在 什么 时 
候 可 以 肯定 程序 的 输出 不 会 受到 优化 的 影响 : 检查 在 原 程序 中 和 在 修改 后 的 程序 中 , 对 同一 内 存 
位 置 的 各 个 运算 被 执行 的 顺序 是 否 一 样 。 在 当前 的 研究 中 , 我 们 关注 的 是 数组 访问 , 因此 数组 元 
素 就 是 需要 考虑 的 内 存 位 置 。 

如 果 两 个 访问 (不 管 是 读 还 是 写 ) 指向 两 个 不 同 的 位 置 , 显然 它们 是 相互 独立 的 (可 以 被 重 
新 排序 ) 。 另 外 , 读 运 算 不 会 改变 内 存 的 状态 , 因此 各 个 读 运算 之 间 是 独立 的 。 根 据 11.5 节 的 介 
43, 如果 两 个 访问 指向 同一 个 内 存 位 置 并 且 其 中 至 少 有 一 个 写 运算 , 那么 就 说 这 两 个 访问 是 数据 
依赖 的 。 为 了 保证 修改 后 的 程序 和 原 程序 做 同样 的 事情 , 每 一 对 有 数据 依赖 关系 的 运算 在 原 程 
序 中 的 执行 顺序 必须 在 新 的 程序 中 得 到 保持 。 

回顾 一 下 10. 2. 1 节 , 可 知 存在 三 种 类 型 的 数据 依赖 : 

1) 真 依赖 , 一 个 写 运 算 后 面 跟 一 个 对 同一 个 内 存 位 置 的 读 运算 。 

2) 反 依 赖 ， 一 个 读 运 算 后 面 跟 一 个 对 同一 个 内 存 位 置 的 写 运算 。 
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3) 输出 依赖 ,是 两 个 针对 同一 个 位 置 的 写 运算 。 

在 上 上面 的 讨论 中 ,数据 依赖 是 针对 动态 访问 定义 的 。 只 要 一 个 程序 的 某 个 静态 访问 的 某 个 
动态 实例 依赖 于 男 一 个 静态 访问 的 某 个 动态 实例 , 我 们 就 说 第 一 个 静态 访问 依赖 于 第 二 个 静态 
WAS, 

我 们 可 以 很 容易 看 出 数据 依赖 关系 如 何 应 用 到 并 行 化 中 。 比 如 , 如果 在 一 个 循环 的 各 个 访 
问 之 间 没 有 发 现 数据 依赖 关系 , 那么 就 可 以 很 容易 地 把 不 同 的 欠 代 分 配给 不 同 的 处 理 器 。11.7 

节 将 讨论 如 何 系统 化 地 将 这 个 信息 应 用 到 并 行 化 中 。 
11.6.1 数组 访问 的 数据 依赖 关系 的 定义 

让 我 们 考虑 对 同一 个 数组 的 两 个 静态 访问 ,它们 可 能 位 于 不 同 的 循环 中 。 第 -一 个 访问 用 访 
癌 函 数 和 界限 表示 为 F= <F,f,B, b>, 它 位 于 一 个 深度 为 d WUE DT; 第 二 个 访问 表 
示 为 史 = <F',f',B' ,7 >，, 它 位 于 一 个 深度 为 d' 的 程序 概 套 结构 中 。 如 果 下 面 的 条 件 成 立 , 这 
e 

) 它们 中 至 少 有 一 个 是 写 运算 , 是 

5 存在 24 中 的 向 量 i 和 2* 中 的 向 量 之 使 得 

@ Bit+b>z0 

© B'i! +b>0 

@ Fi+f = F'i'+f 

因为 一 个 静态 访问 通常 会 产生 多 个 动态 访问 , 所 以 考虑 它 的 多 个 动态 访问 是 和 否 可 能 指向 同 
一 个 内 存 位 置 也 是 有 意义 的 。 为 了 寻找 同一 个 静态 访问 的 不 同 实例 之 间 的 依赖 关系 , 我 们 假设 
Fa=F' 并 在 上 面 的 定义 中 加 入 附加 条 件 ii ASAE PLA o 
1. 29 考虑 下 面 的 深度 为 1 的 循环 嵌 套 结构 : 
for (i = 1; i < 10; i++) { 


Z[il = 2[i-1]; 
} 


这 个 循环 具有 两 个 数组 访问 : Z[-1] 和 2 让。 第 一 个 访问 是 读 运 算 ， 而 第 二 个 访问 是 写 运 算 。 
i al PI ena 我 们 需要 检查 这 个 写 运算 和 它 自身 以 及 上 面 的 读 运 

1) ee et eer es 除了 第 一 个 迭代 , 每 个 迭代 都 会 读 取 前 一 个 迭代 
写 人 的 值 。 从 数学 的 角度 看 ,因为 存在 整数 i 和 i 使 得 

1<i<10, 1<i'<10, Hi-1=i' 

所 以 我 们 知道 它们 之 间 存 在 一 个 依赖 关系 。 上 面 的 约束 系统 有 九 个 解 : (i=2,i =1), G= 
3,0 =2), SS, 

2) ZI 和 它 自 身 之 间 的 依赖 关系 。 可 以 看 到 , 这 个 循环 的 不 同和 迭代 问 不 同 的 位 置 写 人 数 
据 。 也 就 是 说 , 写 访问 Z 器 的 各 个 实例 之 间 不 存在 数据 依赖 关系 。 从 数学 的 角度 看 , 因为 不 存在 
整数 i 和 和 i 满足 条 件 





1<i<10, 1<i’ <10, i=7', Hii’ 
因此 我 们 知道 实例 之 间 不 存在 依赖 关系 。 请 注意 , ZITA SPE i =i EIA A BOR 
Zl i) AZE] 必须 在 同一 个 位 置 上 。 和 这 个 条 件 矛 盾 的 第 四 个 条 件 i 是 因为 要 求 依赖 关系 必 





O 回忆 一 下 静态 访问 和 动态 访问 之 间 的 区 别 。-- 个 静态 访问 是 程序 中 某 个 位 置 二 的 数组 引用 ， 而 一 个 动态 访问 是 这 
个 引用 的 一 次 执行 。 
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须 是 非 平 必须 是 不 同 动态 访问 之 间 的 依赖 关系 。 

ae eee ue 因此 不 需要 考虑 上 面 的 读 引 用 ZL i -1 | AE AS ATK 
关系 。 go 
11.6.2 整数 线性 规划 

对 数据 依赖 关系 的 分 析 要 求 找 出 是 否 存 在 一 些 整数 满足 由 等 式 和 不 等 式 组 成 的 约束 系统 。 
其 中 的 等 式 是 从 数组 访问 的 矩阵 - 向 量 表示 中 得 到 的 ; 不 等 式 是 从 循环 界限 中 得 到 的 。 等 式 可 
以 用 不 等 式 表示 : 等 式 x=y 可 以 用 两 个 不 等 式 *>y 和 yx 表示 。 

因此 , 数据 依赖 关系 问题 可 以 被 表示 为 寻找 满足 一 组 线性 不 等 式 的 整数 解 ， 这 个 问题 就 是 众 
所 周知 的 整数 线性 规划 (integer linear programming) 。 整 数 线性 规划 是 一 个 NP 完全 问题 。 虽 然 没 
有 已 知 的 多 项 式 复杂 性 的 算法 , 但 人 们 研发 了 多 种 启发 式 解法 来 解决 涉及 很 多 变量 的 线性 规划 
问题 。 这 些 解法 在 很 多 情况 下 运行 得 是 相当 快 的 。 遗 憾 的 是 ,这 样 的 标准 启发 式 解法 并 不 适合 
数据 依赖 关系 分 析 。 在 数据 依赖 分 析 中 , 问题 的 难点 在 于 如 何 解决 很 多 小 且 简 单 的 整数 线性 规 
划 ， 而 不 是 大 型 的 复杂 整数 线性 规划 。 

数据 依赖 关系 分 析 算 法 由 三 个 部 分 组 成 : 

1) 使 用 丢 番 图 方程 的 理论 , 应 用 GCD( Greatest Common Divisor, 最 大 公约 数 ) 测 试 来 检验 是 
否 存 在 满足 问题 中 所 有 等 式 的 整数 解 。 如 果 没 有 整数 解 , 那么 就 不 存在 数据 依赖 关系 , 否则 就 用 
等 式 来 替换 其 中 的 某 些 变 量 , 从 而 得 到 较 简 单 的 不 等 式 组 。 

2) 使 用 一 组 简单 的 启发 规则 来 处 理 大 量 的 典型 不 等 式 。 

3) 在 少数 情况 下 , 这 些 启发 式 规则 可 能 还 解决 不 了 问题 。 此 时 , 我 们 使 用 线性 整数 规划 求 
解 程序 来 解决 问题 。 这 个 程序 基于 Fourier-Motzkin 消除 算法 , 使 用 了 一 一 种 分 支 并 设 限 的 方法 来 
求解 。 

11.6.3 GCD 测试 

第 一 个 子 程序 检验 是 否 存 在 满足 约束 中 各 个 等 式 的 整数 解 。 只 考虑 整数 解 的 方程 称 为 丢 番 
图 方程 (Diophantine equation) 。 下 面 的 例子 说 明了 只 考虑 整数 解 会 带 来 什么 问题 ; 同时 它 也 说 
AA, 虽然 很 多 例子 中 每 次 只 涉及 单个 循环 嵌 套 结构 ,数据 依赖 关系 的 公式 表达 还 可 以 被 应 用 到 位 
于 不 同 循环 中 的 数组 访问 。 
考虑 下 面 的 代码 片段 


for (i = 1; i < 10; i++) { 
Z[2*i] = ...; 





} 
for (j = 1; j < 10; j++) { 
2[2#j+1] = ...; 


访问 Z[2* i] Ake ZAMS IK, 而 访问 Z[2 *j+1]j] 只 触及 奇数 号 元 素 。 显 然 , 如 果 省 略 号 
表示 的 右 部 不 涉及 2 的 运算 , 那么 不 管 循环 的 界限 如 何 , 这 两 个 访问 之 间 没 有 数据 依赖 关系 。 我 
们 可 以 在 第 一 个 循环 执行 之 前 就 执行 第 二 个 循环 , 或 者 交叉 执行 这 两 个 循环 的 迭代 。 这 个 例子 
看 起 来 是 人 为 设计 的 、 没 有 实际 意义 , 其实 不 然 。 数 组 的 偶数 号 元 素 与 奇数 号 元 素 被 分 开 处 理 的 

一 个 实际 例子 是 复数 数组 ， 其 中 各 个 复数 的 实 部 和 虚 部 各 占 一 个 元 素 , 并 列 存放 。 

为 了 证 明 这 个 例子 中 没有 数据 依赖 关系 , 我 们 做 如 下 论证 。 假 设 存在 整数 上 和 7 使 得 Z[2 * 
让 和 2Z[2*j+1] 是 同一 个 数组 元 素 , 我 们 得 到 丢 番 图 方程 

2i =2j+1 
没有 整数 i 和 j 可 以 满足 上 面 的 方程 。 证 明 如 下 : WR i eT BR, 那么 2i 就 是 偶数 。 如 
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果 / 是 一 个 整数 ,那么 刀 是 偶数 , 因此 好 +1 是 奇数 。 没 有 哪个 偶数 同时 也 是 奇数 。 因 此 ， 这 个 
方程 没有 整数 解 , 因此 这 两 个 写 访问 之 间 没 有 依赖 关系 。 
为 了 描述 一 个 线性 丢 番 图 方程 什么 时 候 有 解 ， RIRES AMARE MERNEK AA 
的 概念 。 多 个 整数 cl , a2, +, a, 的 GCD, 记 为 gcd(aj ,42,…,a,), 是 能 够 整除 这 些 整数 的 最 大 
整数 。GCD 可 以 使 用 著名 的 欧 几 里 德 算法 ( 见 下 面 的 “ 欧 几 里 德 算法 "部 分 ) 快速 地 计算 。 
FERRE cd (24,36,54) = 6, 因为 24/6.36/6 和 54/6 的 余数 都 是 0, 而 且 用 任何 大 于 6 的 整 
数 去 除 24 .36 .54 时 , 至少 有 一 个 余数 非 零 。 比 如 ，12 能 够 整除 24 和 36, 但 是 不 能 整除 54。 
GCD 的 重要 性 体现 在 下 面 的 定理 中 。 
Poe, 线性 丢 番 图 方程 
































A,X) +X 十 十 CnXn 二 C 





有 Hy X23 Nn 的 一 个 整数 解 ， SAMY gcd (a, 47 ,°°° ,an ) 能 够 整除 Co [i] 
ALE 在 例 11.30 中 , 我 们 看 到 线性 丢 番 图 方程 22=217+1 无 解 。 我 们 可 以 把 这 个 方程 写作 
2 


现在 ged(2, -2) =2 B2 不 能 整除 1。 因 此 方程 无 解 。 

再 看 另 一 个 例子 ,考虑 方程 

24x +36y +54z = 30 

因为 gcd(24,36,54) =6 8 30/6 =5, 因此 存在 x M z 的 整数 解 。 其 中 的 一 个 解 是 x= -1, y =0 
且 z=1, 但 是 存在 无 穷 多 个 其 他 的 解 。 口 

数据 依赖 关系 问题 的 第 一 步 是 使 用 一 个 诸如 高 斯 消除 算法 的 标准 方法 来 求解 给 定 的 方程 组 。 
每 构造 出 一 个 线性 方程 , 就 应 用 定理 11. 32 尽 可 能 地 排除 整数 解 的 存在 。 如 果 我 们 能 够 排除 这 样 
的 整数 解 ， 那么 答案 就 是 “ 否 "。 否 则 我 们 使 用 这 些 方程 的 解 来 减少 不 等 式 中 的 变量 数目 。 
Gil 11. 34 考虑 两 个 方程 











x -2y+2=0 
3x +2y+z=5 
从 各 个 方程 本 身 来 看 是 存在 解 的 。 对 于 第 一 个 方程 , gcd(1, -2,1) =1 能 够 整除 0, 而 对 于 第 二 
个 方程 , gcd(3,2,1) =1 能 够 整除 5。 但 是 , 如 果 我 们 求解 第 一 个 方程 得 到 z=2y -x, 并 以 此 替代 
第 二 个 方程 中 的 :, 我 们 得 到 2x +4y =5。 因 为 gcd(2,4) =2 不 能 整除 5, 所 以 这 个 等 番 图 方程 无 
解 。 口 





欧 几 里 德 算法 

欧 几 里 德 算法 按照 下 面 的 方法 找 出 gcd(a,5) 的 值 。 首 先 , 假设 a 和 6 为 正 整 数 , Hazb, 
请 注意 ,多 个 负数 的 GCD ,或 一 个 负数 与 一 个 正 数 的 CCD 等 于 它们 的 绝对 值 的 CCD, 因此 可 
以 假设 所 有 的 整数 都 是 正 的 。 

WMR a=b, 那么 ged(a,b) =a。 如 果 a>b, 令 ec 为 ab 的 余数 。 如 果 <=0, MAb 整除 a， 
因此 ged(a,b) =b, Bill, 计算 gcd(b,c) 得 到 的 结果 也 是 gcd(a,6)。 

为 了 计算 n>2 时 的 gcd(ai ,aa ,…,an) ,使 用 欧 几 里 德 算法 来 计算 gcd(a1 ,az ) =c, 然 后 递 
归 地 计算 gcd(c,@3,44,°°,4,) 0 
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11.6.4 解决 整数 线性 规划 的 启发 式 规 则 

数据 依赖 关系 问题 需要 求解 很 多 简单 的 整数 线性 规划 问题 。 现 在 我 们 讨论 处 理 简单 不 等 式 
组 的 几 个 技术 ,以 及 一 个 可 以 利用 在 数据 依赖 关系 分 析 时 发 现 的 相似 性 的 技术 。 

独立 变量 测试 

从 数据 依赖 关系 分 析 中 得 到 的 很 多 整数 线性 规划 问题 由 多 个 只 涉及 一 个 未 知 量 的 不 等 式 组 
成 。 这 类 规划 问题 的 解法 很 简单 ， 只 需要 分 别 测试 常量 上 界 和 常量 下 界 之 间 是 否 存在 整数 即 可 。 
11. 35 考虑 说 套 循 环 结构 


for (i = 0; i <= 10; i++) 
for (j = 0; j <= 10; j++) 
Z[i,j] = Z[j+10,i+11]; 


为 了 找 出 Z[i, 旭 和 ZLj+10,i+11j] 之 间 是 否 存 在 数据 依赖 关系 , 我 们 考虑 是 否 存在 整数 i,j, 六 和 
了 ,使 得 





0<i,j,i’ j S10 
i=j +10 
j=i'+1l 
对 其 中 的 方 禄 应 用 GCD 测试 可 以 确定 可 能 存在 一 个 整数 解 。 这 些 方程 的 整数 解 可 表示 
如 下 : 
i = j=, i =t,-11, j Sh -10 
其 中 , 4) Alt, PERES, HAR, My 代 人 上 面 的 线性 不 等 式 , 我 们 得 到 


O< ty <10 


© 


ty <10 


© 


< 
< t-11 <10 
0s 4-10 <10 
这 样 , 把 根据 后 两 个 不 等 式 得 到 的 下 界 与 根据 前 两 个 不 等 式 得 到 的 上 界 组 合 起 来 , 我 们 推出 
10<i, <10 
ll< 410 
因为 的 下 界 大 于 它 的 上 界 , 因此 不 存在 整数 解 , 也 就 没有 数据 依赖 关系 。 这 个 例子 说 明 ， 
即使 存在 涉及 多 个 变量 的 等 式 , GCD 测试 (原文 如 此 , 实际 应 该 是 独立 变量 测试 , 译 者 注 ) 依 然 可 





以 构造 出 每 个 不 等 式 只 涉及 一 个 变量 的 线性 不 等 式 组 。 口 
无 环 测试 


另 一 个 简单 的 启发 式 规 则 是 寻找 是 否 存在 一 个 其 上 界 或 下 界 为 常量 的 变量 。 在 某 些 情况 下 ， 
我 们 可 以 安全 地 用 这 个 常量 来 替换 这 个 变量 。 简 化 后 的 不 等 式 组 有 一 个 整数 解 当 且 仅 当 原 来 的 
不 等 式 组 有 一 个 整数 解 。 明 确 地 说 , 假设 v 的 每 个 下 界 都 具有 如 下 形式 : 

对 于 某 个 c; >0, co Se,0; 











同时 wi 的 上 界 都 具有 如 下 形式 : 

C;V; S Co +CV H't +C; Ving HC 40; 4, tor +envn 
其 中 , ci 是 非 负 整数 。 那 么 我 们 可 以 把 变量 v; BRAR EESE. MRAR TFA, 
我 们 可 以 把 w SRA - m 。 类 似 地 , 如 果 涉 及 v 的 所 有 约束 都 可 以 表示 成 上 面 的 两 种 形式 , 但 
是 不 等 号 的 方向 相反 , 那么 我 们 可 以 把 变量 w 替换 为 最 大 的 可 能 整数 值 , 或 者 在 没有 常量 上 界 时 
替换 为 we 。 可 以 重复 这 个 步骤 对 不 等 式 不 断 化 简 , 在 某 些 情况 下 可 以 确定 不 等 式 无 解 。 
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O11. 36 考虑 下 面 的 不 等 式 : 


? á 
0 三 v3 <4 
V S vi 
vy <n +4 


变量 的 下 界 由 vo 确定 ,而 上 界 由 v +4 人 确定。 但 是 , KE 下 界 的 只 有 常量 1， 界定 v3 LH 
的 只 有 常量 4。 因 此 , 在 这 些 不 等 式 中 把 奉 换 为 1 并 把 v3 替换 为 4, 我 们 得 到 


ls v <10 


le ov 
vl <8 
现在 这 个 不 等 式 组 可 以 很 容易 地 使 用 独立 变量 测试 的 方法 求解 。 口 


循环 残 数 测试 

现在 让 我 们 考虑 每 个 变量 的 上 下 界 都 由 其 他 变量 确定 的 情况 。 在 数据 依赖 分 析 中 经 常会 碰 
到 形 如 v, So, te 的 约束 。 这 种 情况 可 以 使 用 Shostak 提出 的 循环 残 数 测 试 (loop-residue test ) 的 一 
个 简化 版 本 来 求解 。 这 样 的 一 组 约束 可 以 用 一 个 有 向 图 表示 。 这 个 图 的 结 点 标号 为 不 等 式 中 的 
变量 。 对 于 每 一 个 约束 0; <0, +c, 都 有 一 条 从 结 点 v; 到 v 的 标号 为 e 的 对 应 边 。 

我 们 把 一 条 路 径 的 权重 (weight) 定 义 为 该 路 径 上 所 有 边 的 标号 的 和 。 图 中 的 每 条 路 径 表 示 此 
约束 系统 中 的 一 组 约束 的 组 合 。 也 就 是 说 ,只 要 存在 一 条 从 v 到 w' 的 权重 为 c 的 边 , 我 们 就 可 以 
推断 出 vs<v + c。 图 中 的 一 条 权重 为 e 的 环 表示 对 环 中 的 每 个 结 点 v 都 存在 约束 vv+c。 如果 
我 们 能 够 在 图 中 找到 一 个 权重 为 负 的 环 , 那么 就 可 以 推断 出 v<v, 而 这 是 不 可 能 成 立 的 。 此 时 ， 
我 们 断定 不 等 式 组 无 解 , 因此 也 就 没有 依赖 关系 。 

我 们 也 可 以 把 形 如 cv 或 v<c 的 约束 放 到 循环 残 数 测试 中 去 ， 这 里 "是 一 个 变量 ,ec 是 一 个 
常量 。 我 们 向 不 等 式 系 统 引 入 一 个 新 的 哑 变 量 zx。 这 个 哑 变 量 被 加 到 每 个 常量 上 界 和 常量 下 界 
上 。 当 然 vo 的 值 一 定 是 0, 但 是 因为 循环 残 数 测试 只 寻找 图 中 的 环 , 变量 的 实际 值 并 不 重要 。 为 
了 处 理 常 量 上 下 界 , 我 们 把 

vse 替换 为 vvo +e 
cxv RBH vo <u -co 


B11. 37 考虑 不 等 式 aa. 


oo + 
Is n, <10 PEN 
0s 23 <4 O 0 >, -4 (5) ae 
ns v1 aoe 
20, <20,- 7 IG aS g P 
变量 AEL RAET vso -1 和 vw Sv + = 
10; v Al V4 的 常量 界限 也 可 以 做 类 似 的 处 理 。 然 图 11-21 例子 11.37 中 的 约束 的 图 形 表示 
后 , 把 最 后 一 个 约束 转换 成 Sv, -4, 我 们 就 得 到 
图 11-21 中 显示 的 图 。 环 w .oa .oo .ol 的 权重 为 -1, 因此 这 个 不 等 式 组 无 解 。 口 
记忆 模式 
因为 一 些 简单 的 访问 模式 会 在 整个 程序 中 重复 出 现 , 我 们 经 常 需要 重复 求解 类 似 的 数据 依 
赖 关系 问题 。 提 高 数据 依赖 关系 的 处 理 速度 的 重要 技术 之 一 是 使 用 记忆 模式 (memoization) 。 这 
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个 模式 在 生成 一 个 问题 的 结果 之 后 就 把 这 个 结果 用 表格 记录 下 来 。 每 次 处 理 此 类 问题 的 时 候 ， 
算法 都 会 查询 这 个 表 。 只 有 在 表 中 找 不 到 被 处 理 问题 的 结果 时 才 和 需要 从 头 求解 这 个 问题 。 
11.6.5 解决 一 般 性 的 整数 线性 规划 问题 

现在 我 们 描述 一 个 解决 整数 线性 规划 问题 的 一 般 性 方法 。 这 个 问题 是 NP - 完全 的 。 我 们 的 
算法 使 用 了 一 个 分 支 -界定 方法 , 这 种 方法 在 最 坏 情 况 下 花费 的 时 间 为 指数 级 。 但 是 , 11. 6.4 节 
中 的 启发 式 规 则 未 能 解决 问题 的 情况 很 少 出 现 。 并 且 即 使 我 们 需要 应 用 本 节 中 的 算法 ,也 很 少 
需要 执行 算法 中 的 分 支 -界定 步骤 。 

这 个 方法 首先 检查 不 等 式 组 是 否 存 在 有 理 数 解 。 这 个 问题 是 标准 的 线性 规划 问题 。 如 果 不 等 
式 组 不 存在 有 理 数 解 ,问题 中 的 数组 访问 所 触及 的 数据 区 域 就 一 定 不 相交 , 因此 一 定 不 存在 数据 依 
赖 关系 。 如 果 存 在 有 理 数 解 , 我 们 首先 试图 证 明 存 在 一 个 整数 解 (通常 会 有 这 样 的 解 ) 。 如 果 不 能 证 
明 这 一 点 ， D EA = 的 多 面体 分 割 为 两 个 较 小 的 问题 , 并 递归 地 解决 问题 。 


考虑 下 面 的 简单 循环 : 


for (i = 1; i < 10; i++) 
z[i] = Z[i+10]; 


访问 Z[ 让 所 触及 的 元 素 是 Z[1] … .2Z[9], 而 访问 ZL i+ 10] 所 触及 的 元 素 是 Z[11]、…、Z[19]。 
这 两 个 范围 并 不 相交 , 因此 不 存在 数据 依赖 关系 。 更 严格 地 讲 , 我 们 需要 说 明 不 存在 两 个 动态 访 
问 i 和 i 满足 1 <i <9,1 si <9 有 目 i=i'+10。 如 果 存 在 这 样 的 整数 i 和 ,那么 可 以 用 i +10 
KB, 并 得 到 四 个 关于 i 的 约束 : 1 <i’ <9 和 1 <i'+10 <9, (AZ, i’ +10 <9 MA <-1, 
这 和 1 <z 了 矛盾 。 因 此 不 存在 这 样 的 整数 ; 和 i。 o 

算法 11. 39 描述 了 如 何 基于 Fourier-Motzkin 消除 算法 来 确定 是 否 可 以 找到 一 组 线性 不 等 式 的 
整数 解 。 
整数 线性 规划 问题 的 分 支 界定 解法 。 

输入 : 一 个 变量 由 ，…, 0, 上 的 多 面体 5,。 

输出 : 如 果 S, 有 一 个 整数 解 , 输出 “yes”， 否 则 输出 “no" 。 

方法 : 图 11-22 中 给 出 的 算法 。 o 














1) 对 Sn ee 11.11 ， 把 变量 
;ul 按 顺 序 通过 投影 消除 ; 
2 令 Si Spiga BAC MB v n 之 后 得 到 I 的 多 面体 ， 共 中 
t=n-1,n-2,. 
3 if So 44 return “no” 
J5 如 果 只 涉及 常量 的 So 具有 不 可 满足 的 约束 ， 
就 不 存在 有 理 数 解 */ 
for (i = 1;i < nit) { 
if (S: 不 包含 整数 解 break; 
令 ci J Sih vi 的 取 值 范围 正中 的 整数 值 ; 
把 vi; 起 换 为 ct， 修改 Si; 





if (i == n + 1) return “yes”; 

if (i == 1) return “no”; 

aS; 中 Yr 的 下 界 和 上 界 分 别 为 li 和 uz; 

对 Sn U {vi S LJ} AS, U {vi > furl} 递归 应 用 
KARER Sn U {vi > ful}: 

if ( 有 一 个 结果 为 “yes”) return “yes” else return “no”; 
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图 11-22 寻找 不 等 式 的 整数 解 
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第 1 行 到 第 3 行 试图 找 出 不 等 式 组 的 一 个 有 理 数 解 。 如 果 没 有 有 理 数 解 ， 就 没有 整数 解 。 如 
果 找 到 一 个 有 理 数 解 ， 就 表明 这 个 不 等 式 组 定义 了 一 个 非 空 的 多 面体 。 这 样 的 一 个 多 面体 不 所 
含 整 数 解 的 情况 相对 较 少 要 是 出 现 这 种 情况 , 这 个 多 面体 在 某 些 维度 上 必然 很 薄 , 而 且 位 于 
整数 点 之 间 。 

因此 , 第 4 行 到 第 9 行 试图 快速 检查 是 否 存在 一 个 整数 解 。Fourier-Motzkin 消除 算法 的 每 一 
步 都 会 产生 一 个 多 面体 , 其 维度 比 前 一 个 多 面体 的 维度 小 1。 我 们 反 向 考虑 这 些 多 面体 。 我 们 从 
只 有 一 个 变量 的 多 面体 开始 , 在 可 能 的 情况 下 , 向 这 个 变量 赋予 一 个 大 概 处 于 它 的 取 值 范围 中 间 
的 整数 值 。 然 后 , 我 们 在 所 有 其 他 的 多 面体 中 用 这 个 值 来 替代 这 个 变量 , 把 这 些 多 面体 的 未 知 量 
的 数目 减 一 。 不 断 重复 这 个 过 程 , 直到 所 有 的 多 面体 都 得 到 处 理 , 或 者 找到 了 一 个 没有 整数 解 的 
变量 。 在 前 一 种 情况 下 , 我 们 可 以 找到 一 个 整数 解 。 

如 果 我 们 甚至 不 能 为 第 一 个 变量 找到 整数 值 , 那么 整个 不 等 式 组 就 不 存在 整数 解 ( 第 10 
ÍT). TU, 我 们 所 知道 的 全 部 情况 就 是 没有 哪个 整数 解 会 包含 至 今 为 止 我 们 为 一 些 变量 选择 的 
特定 整数 值 。 这 个 结论 不 是 决定 性 的 。 第 11 行 到 第 13 行 表示 算法 的 分 支 - 界定 步骤 。 如 果 发 
现 变量 v; 具有 有 理 数 解 但 是 没有 整数 解 ， 就 把 问题 中 的 多 面体 分 成 两 个 多 面体 , 第 一 个 要 求 v 
必须 是 小 于 已 找到 的 有 理 数 的 整数 , 第 二 个 要 求 v; 必须 是 一 个 大 于 此 有 理 数 解 的 整数 。 如 果 两 
个 多 面体 都 没有 整数 解 , 那么 就 不 存在 依赖 关系 。 

11. 6.6 小 结 

我 们 已 经 说 明 一 个 编译 器 能 够 从 数组 引用 中 收集 到 的 信息 的 主要 部 分 和 某 些 标准 数学 概念 
等 价 。 给 定 一 个 访问 水 数 .9= <F,f,B,b>: 

1) 被 访问 的 数据 区 域 的 维度 由 矩阵 FF 的 秩 给 出 。 访 问 同一 位 置 的 访问 空间 的 维度 就 是 的 
零 数 。 如 果 两 个 迭代 向 量 的 差 值 属于 FF 的 零 空 间 , 那么 这 两 个 迭代 指向 同一 个 数组 元 素 。 

2) 同一 个 数组 访问 的 具有 自 时 间 复 用 关系 的 多 个 迭代 之 间 的 差距 是 的 零 空 间 中 的 向 量 。 
自 空间 复 用 可 以 用 类 似 的 方式 计算 得 到 , 但 不 是 考虑 两 个 迭代 何 时 使 用 同一 个 元 素 , 而 是 考虑 它 
们 何 时 使 用 同一 行 元 素 。 两 个 访问 Fi, +f, MFL +f, 沿 着 向 量 4d 的 方向 具有 易于 利用 的 局 部 性 ， 
其 中 4d 是 方程 Fd = (fi -fo ) 的 菜 个 解 。 特 别 是 当 4d 的 方向 和 最 内 层 循 环 对 应 时 ， Bld 为 向 量 [0， 
0,…,0,1] 时 ,如 果 数 组 是 按 行 存 放 的 , 那么 就 会 存在 空间 局 部 性 。 

3) 数据 依赖 关系 问题 一 一 两 个 引用 是 否 可 能 指向 同一 个 位 置 一 一 和 整数 线性 规划 等 价 。 两 
个 访问 函数 之 间 县 有 数据 依赖 关系 的 条 件 是 存在 值 为 整数 的 向 量 i 和 i, 使 得 Bi 二 0, Bi’ S0, 并 
HFi+f=F'i' +f. 

11.6.7 11.6 节 的 练习 

练习 11. 6. 1: 找 出 下 列 整数 集合 的 CCD: 

1) {16,24,56}, 

2) | 45,105,240} 。 

1 3) {84,105,180 ,315 350} 。 

练习 11.6.2: 对 于 下 面 的 循环 


for (i = 0; i < 10; i++) 
Afi] = A[10-i]; 


指出 所 有 的 

1) 真 依赖 关系 ( 即 写 运算 后 跟着 对 同一 个 位 置 的 读 运算 ) 。 

2) 反 依 赖 关 系 ( 即 读 和 运算 后 跟着 对 同一 个 位 置 的 写 运算 ) 。 

3) 输出 依赖 关系 ( 即 写 运 算 后 跟着 对 同一 个 位 置 的 另 一 个 写 运算 ) 。 























524 第 11 章 





| 练习 11. 6. 3: 在 介绍 欧 几 里 得 算法 的 部 分 中 , 我 们 未 经 证 明 就 给 出 了 一 些 断 言 。 证 明 下 
面 的 每 一 个 断言 : 

1) 该 部 分 所 述 的 欧 几 里 得 算法 总 是 能 够 工作 。 特 别 地 , ged(b,c) =ged(a,b), Htc Æ a/b 
的 非 零 余数 。 

2) ged(a,b) = gcd(a, -6). 

3) 4n>2 it, gcd(a ,a3,,0,) =ged(gced(a;, a2) ,aa an)。 

4) GCD 实际 上 是 一 个 整数 集合 上 函数 ， 即 整数 的 顺序 并 不 重要 。 说 明 GCD AY RRR, 
gcd(a,b) =gcd(b,a)。 然 后 证 明和 更 加 困难 的 结论 , B CCD 的 结合 律 : gcd( gcd(a,b6),c) = ged(a, 
ged(b,c)) RE, 说 明 上 述 这 些 定律 蕴含 了 下 面 的 性 质 ; 不 管 按 照 什 么 样 的 顺序 来 计算 各 个 整 
数 对 的 GCD ,得 到 的 一 个 整数 集合 的 CCD 总 是 相同 的 。 

5) WR 5S 和 了 都 是 整数 集合 , 那么 ged(SUT) = gcd(gcd(S),gcd(7))。 

| 练习 11. 6.4; 找 出 例 11.33 中 的 第 二 个 委 番 图 方程 的 另 一 个 解 。 

练习 11. 6. 5: 在 下 面 的 情况 中 应 用 独立 变量 测试 。 循 环 骨 套 结构 是 

for (i=0; 1<100; i++) 


for (j=0; j<100; j++) 
for (k=0; k<100; k++) 


在 嵌 套 结构 中 是 一 个 关于 数组 访问 的 赋值 语句 。 确 定 下 面 的 每 一 个 语句 是 否 会 引起 某 些 数据 依 
MKR 
1) Ali, j,k] = ALi+100,j+100,k+100] 
2) Ali,j,k] = AL}+100,k+100, i+100] 
3) ALi, i,k] = ALj-50,k-50, 1-50] 
4) Afi,j,k] = A{i+99,k+100,j] 
练习 11. 6. 6: 在 下 面 的 约束 中 , 通过 把 x 蔡 换 为 y( 原 文 如 此 , 译 者 注 ) 的 常量 下 界 来 消除 x。 
l<x<y- 100 
3<«%<2y-50 
练习 11. 6.7: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
0O<x<99 y<x-50 
O<y<99 z<y-60 
0< 2<99 
练习 11. 6. 8: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
ls<x<99 yx-50 
0<y<99 zy+40 
Os 2<99 x z+20 
练习 11. 6.9: 对 下 面 的 约束 集合 应 用 循环 残 数 测试 : 
0O<x<99 y<x- 100 
O<yx99) z<y +60 


Os 2599 x z+50 


11.7 寻找 无 同步 的 并 行 性 


我 们 已 经 得 到 了 关于 仿 射 数组 访问 , 访问 之 间 对 数据 的 复 用 , 以 及 它们 之 间 的 依赖 关系 的 理 
论 。 现 在 我 们 将 应 用 这 些 理论 来 对 实际 程序 进行 并 行 化 及 优化 处 理 。 如 11. 1.4 节 中 所 讨论 的 ， 
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在 找到 并 行 性 的 同时 保证 处 理 器 之 间 通 信 基 的 最 小 化 是 很 重要 的 。 我 们 首先 研究 如 何 存 完全 不 
允许 处 理 器 之 间 进 行 通信 或 同步 的 情况 下 实现 并 行 化 的 问题 。 这 个 约束 可 能 看 起 来 像 是 一 个 纯 
学 术 的 练习 ， the te On tate ti ea de se a 
活 中 存在 很 多 这 样 的 程序 , 因此 解决 这 个 并 行 化 问题 的 算法 本 身 就 是 有 用 的 。 另 外 , 可 以 扩展 解 
决 这 个 问题 时 使 用 的 概念 以 处 理 同步 和 通信 。 
11.7.1 一 个 介绍 性 的 例子 

图 11-23 中 显示 的 是 从 一 个 5000 行 的 Fortran 代码 程序 中 摘录 的 并 以 C 语言 表示 的 程序 片 
段 。 为 清晰 起 见 , 代码 中 仍然 保留 了 Fortran 风格 的 数组 访问 语法 。 诛 来 的 程序 实现 了 用 来 解决 
三 维 欧 拉 方程 的 多 重 网 格 算法 。 这 个 程序 的 大 部 分 运行 时 间 都 花费 在 少数 几 个 如 图 所 示 的 子 程 
序 上 。 它 是 很 多 数值 程序 的 典型 代表 。 这 些 数值 程序 经 常 由 很 多 处 在 不 同 嵌 套 层 次 上 的 for 循环 
组 成 。 它 们 包含 了 很 多 数组 访问 , 所 有 数组 访问 的 下 标 都 是 外 赎 循 环 下 标的 仿 射 表达 式 。 为 了 
使 这 个 例子 比较 简短 , 我 们 已 经 从 原来 的 程序 中 删除 了 一 些 具有 类 似 性 质 的 代码 行 。 





for (j = 2; j <= jl; j++) 
for (i = 2, i <= il, i++) { 
AP[j,i) ; 


= 
T = 1.0/(1.0 + AP[j,i]); 
D(2,j,i] = T*AP[j,i]; 
DW[1,2,j,i] = T*DW[1,2,j,1]; 


} 
for (k = 3; k <= kl-1; k++) 
for (j = 2; j <= jl; j+H 
for (i = 2; i <= il; i++) { 


AM[j ,i] = ee i]; 

AP(j,i] =. 

T = .APDj i] - AM(EJ,i]*D[k-1,j,i]...; 
D[k, j,i] 7 = TeAPL3 4]; 


DW[1,k,j,4] = T*(DW[1,k, j,i] + DW[1,k-1,j,i])...; 
} 


for (k = kl-1; k >= 2; k--) 
for (j = 2; j <= jl; j++) 
for (is 2) a <S oie i+). 
DWL1,k,j,i] = DW(1,k,j,i] + DIk,j, i] *DW[1,k4+4, j,i]; 











— 





图 11-23 一 个 多 重 网 格 算法 的 代码 片断 


图 11-23 的 代码 在 一 个 标量 变量 了 和 一 些 具有 不 同 维度 的 多 个 数组 上 运行 。 我 们 首先 来 看 一 
下 对 变量 7 的 使 用 。 因 为 一 个 循环 中 的 每 个 迭代 使 用 同一 个 变量 7, 我 们 不 能 并 行 执 行 这 些 闪 
代 。 但 是 了 只 是 用 于 存放 在 一 个 迭代 中 使 用 两 次 的 公共 子 表达 式 的 值 。 在 图 11-23 中 的 前 两 个 循 
TET, 最 内 层 循环 的 各 个 迭代 向 了 中 写 人 一 个 值 ， 然后 立刻 在 同一 个 迭代 中 两 次 使 用 这 个 
值 。 我 们 可 以 把 对 7 了 的 每 次 使 用 替换 为 前 面 对 7 的 赋值 语句 的 右 部 表达 式 , 从 而 在 不 改变 程序 
语义 的 前 提 下 消除 依赖 关系 。 我 们 也 可 以 把 标量 7 替换 为 一 个 数组 。 然 后 我 们 让 每 个 兴 代 (j,i 
使 用 它 自己 的 数组 元 素 T[j,i]。 

经 过 这 样 的 修改 , 每 个 赋值 语句 中 对 一 个 数组 元 素 的 计算 只 依赖 于 最 后 两 个 下 标 分 量 值 (分 
别 是 j 和 让 相同 的 其 他 数组 元 素 。 因 此 , 我 们 可 以 把 对 各 个 数组 的 第 (j,i) 个 元 素 进 行 操作 的 所 有 运 
算 组 合成 为 一 个 计算 单元 , 并 按照 原来 的 串 行 顺序 执行 它们 。 这 个 修改 产生 了 (i -1) x Gil -1) 4 
相互 独立 的 计算 单元 。 请 注意 , 原 程 序 里 第 二 和 第 三 个 循环 嵌 套 结构 涉及 下 标 为 下 的 第 三 个 循 
环 。 但 是 , 因为 具有 同样 的 和 ;i 值 的 动态 访问 之 间 不 存在 依赖 关系 , 所 以 可 以 安全 地 在 / 和 ;i 的 
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循环 内 部 一 一 就 是 说 在 一 个 计算 单元 中 一 一 执行 的 循环 。 

知道 这 些 计 算 单 元 是 独立 的 ,我 们 就 可 以 对 代码 进行 多 个 合法 的 转换 。 比 如 , 一 个 单 处 理 器 
系统 可 以 不 按照 原来 的 代码 执行 ,而 是 逐个 执行 独立 的 运算 单元 ,最 终 完 成 同样 的 计算 工作 。 转 
换 所 得 代码 显示 在 图 11-24 中 。 这 个 代码 具有 更 好 的 时 间 局 部 性 ,因为 计算 中 生成 的 结果 立刻 就 
被 用 掉 了 。 














for (j = 2; j <= jl; j++) 
for (i = 2; i <= il; it+) { 


AP(j,3) ass 
T[j,i] = 1.0/(1.0 + AP[j,i]); 
D[2,j,i] = T[j,i]*AP[j, i]; 
DW[1,2,j,i] = T[j,i] *DW[1,2,j,i]; 
for (k = 3; k <= kl-1; k++) { 
AM[Lj ,i] = AP[j,i]; 
AP[j,i] Sythe 
TU, i] = ,.,AP[j, ij - AM[j,i]*D[k-1,j,i]...; 
D[k,j,i] = T[j,i]*AP[j,i]; 
DWC1,k,j,i] = T[j,i]*(DW[1,k,j, i] + DW[1,k-1,j,i])...; 
} 
for (k = kl-1; k >= 2; k--) 
DW[1,k, j,i] = DW[1,k,j,i] + Dik,j,i]*DWL1,k+1,j,i]; 
} 








图 11-24 经 过 改写 的 图 11-23 的 代码 , 最 外 层 是 并 行 循环 


这 些 独 立 的 计算 单元 也 可 以 被 分 配给 不 同 的 处 理 器 并 行 执行 。 这 些 处 理 器 之 间 不 需要 任何 
同步 或 通信 。 因 为 有 (jl -1) x (il -1) 个 相互 独立 的 计算 单元 , 我 们 最 多 可 以 利用 (jl -1) x 
(il -1) 个 处 理 器 。 我们 可 以 按照 二 维 数组 的 方式 组 织 处 理 器 ,每 个 处 理 器 的 ID 是 (j,i) ,其 中 
2< j<jl,2si< il, 由 各 个 处 理 器 执行 的 SPMD 程序 就 是 图 11-24 中 的 内 层 循 环 的 循环 体 。 

上 面 的 例子 说 明了 寻找 无 同步 的 并 行 性 的 基本 方法 。 我 们 首先 把 计算 任务 分 解 成 尽 可 能 多 
的 独立 单元 。 这 个 分 解 揭示 了 可 行 的 调度 选择 。 然 后 , 我 们 依照 拥有 的 处 理 器 数目 把 这 些 计算 
单元 分 配给 各 个 处 理 器 。 最 后 , 我 们 生成 一 个 在 各 个 处 理 器 上 执行 的 SPMD 程序 。 

11.7.2， 仿 射 空 间 分 划 

如 果 一 个 循环 嵌 套 结构 内 部 具有 上 个 可 并 行 化 的 循环 , 那么 这 个 循环 嵌 套 结构 就 有 上 度 的 并 
行 性 。 一 个 可 并 行 化 循环 的 不 同 选 代 之 间 不 存在 数据 依赖 关系 。 比 如 , 图 11-24 中 的 代码 就 具有 
2 度 并 行 性 。 把 具有 上 度 并 行 性 的 计算 任务 分 配给 一 个 上 维 的 处 理 器 阵列 是 很 方便 的 。 

一 开始 , 我 们 将 候 设 处 理 器 阵列 的 每 个 维度 上 的 处 理 器 数目 和 相应 循环 的 迁 代 个 数 一 样 多 。 在 
找到 所 有 这 些 独立 计算 单元 后 , 我 们 将 把 这 些 "虚拟 ”处理 器 映射 到 实际 的 处 理 器 上 。 在 实践 中 , 每 
个 处 理 器 要 负责 相当 多 的 选 代 , 否则 就 没有 足够 的 工作 量 来 分 捧 并 行 化 所 带 来 的 额外 开销 。 

我 们 把 需要 并 行 化 的 程序 分 解 成 为 类 似 于 三 地 址 语句 这 样 的 基本 语句 。 对 于 每 个 语句 ,我 

们 找 出 一 个 仿 射 室 间 分 划 ( affine space partition) 。 这 个 分 划 把 这 些 语句 的 各 个 动态 实例 映射 到 一 
个 处 理 器 了 D。 这 些 动态 实例 使 用 其 循环 下 标 来 标记 。 
CE 加 上 面 所 讨论 的 , 图 11-24 的 代码 具有 2 度 的 并 行 性 。 我 们 把 处 理 器 阵列 看 作 一 个 
二 维 空间 。 令 (pi ,pz ) 为 这 个 阵列 中 的 一 个 处 理 器 的 四 。 在 11. 7.1 节 中 所 讨论 的 并 行 化 方案 可 
以 使 用 一 个 简单 的 仿 射 分 划 函 数 来 描述 。 在 第 一 个 循环 嵌 套 结构 中 的 所 有 语句 都 有 下 面 的 仿 射 
分 划 : | 
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Piet rl Orj 10 
BaT 
在 第 二 个 和 第 三 个 循环 嵌 套 结构 中 的 所 有 语句 共享 如 下 的 相同 的 仿 射 分 划 : 
Py 0 1 0 0 
EJee o sl te 2 
寻找 无 同步 并 行 性 的 算法 由 三 个 步骤 组 成 : 

1) 为 程序 中 的 每 个 语句 寻找 一 个 能 够 最 大 化 并 行 性 度数 的 仿 射 分 划 。 请 注意 , 我 们 通常 
把 语句 (而 不 是 单个 访问 ) 作 为 计算 的 单元 。 对 于 一 个 语句 中 的 所 有 访问 必须 应 用 同样 的 仿 射 
分 划 。 这 种 对 访问 的 分 组 方法 是 有 意义 的 , 因为 在 同一 个 语句 中 的 访问 之 间 几 乎 总 是 存在 依 
MER 

2) 在 处 理 器 之 间 分 配 由 第 1 步 得 到 的 独立 计算 单元 , 并 选择 在 每 个 处 理 器 上 执行 的 各 个 步 
又 之 间 的 交替 顺序 关系 。 这 个 分 配 主 要 要 考虑 局 部 性 。 

3) 生成 一 个 将 在 各 个 处 理 器 上 执行 的 SPMD 程序 。 

下 面 我 们 将 讨论 如 何 寻找 仿 射 分 划 函 数 , 如 何 生成 一 个 顺序 程序 来 串 行 执行 各 个 分 划 ， 以 及 
如 何 生成 一 个 在 不 同 处理 器 上 执行 各 个 分 划 的 SPMD 程序 。 在 从 11. 8 节 到 11. 9. 9 节 讨 论 了 如 何 
处 理 带 有 同步 的 并 行 性 之 后 , 我 们 将 在 11. 10 节 回 到 上 面 的 第 2 AG, 并 讨论 如 何 针对 单 处 理 器 和 
多 处 理 器 系统 进行 局 部 性 优化 。 

11.7.3 空间 分 划 约 束 

因为 要 求 没有 通信 , 所 以 每 一 对 具有 数据 依赖 关系 的 运算 都 必须 被 分 配 在 同一 个 处 理 器 上 。 
我 们 把 这 些 约束 称 为 “空间 分 划 约 束 " 。 任 何 满足 这 些 约 束 的 映射 所 创建 的 分 划 都 是 相互 独立 的 。 
请 注意 ,只 要 把 所 有 运算 都 放 到 一 个 分 划 单 元 , 就 可 以 满足 这 样 的 约束 。 遗 憾 的 是 , 这 样 的 “ 解 ” 
没有 给 出 任何 并 行 性 。 我 们 的 目标 是 在 满足 这 些 空间 分 划 约 束 的 同时 得 到 尽 可 能 多 的 独立 分 划 。 
也 就 是 说 ， 只 有 在 必要 的 时 候 才 会 把 不 同 的 运算 放 到 同一 个 处 理 器 上 。 

当 我 们 限制 自己 只 考虑 仿 射 分 划 时 , 可 以 将 并 行 性 的 度数 ( 即 维度 ) 最 大 化 , 而 不 是 将 独立 
单元 的 数目 最 大 化 。 如 果 我 们 使 用 分 段 (piecewise) 仿 射 分 划 , 有 时 有 可 能 创建 出 更 多 的 独立 单 
元 。 一 个 分 段 仿 射 分 划 把 单个 访问 的 实例 分 割 成 为 不 同 的 集合 , 并 允许 对 每 个 集合 使 用 不 同 的 
仿 射 分 划 。 但 是 这 里 我 们 不 考虑 这 样 的 选项 。 

正式 地 讲 , 一 个 程序 的 仿 射 分 划 是 无 同步 的 (synchronization free) 当 且 仅 当 对 于 两 个 具有 数 
据 依赖 关系 的 (不 一 定 不 同 的 ) 访 问 , 即 在 循环 谋 套 结构 d 中 的 语句 s 中 的 访问 入 = < 五 ,有 fi， 
B,,b, > AIREAK ds 中 的 语句 ss PHVA = <Fy,f,,B,,b). >, 对 语句 s! 和 ss 的 分 划 
<C,,¢; > 和 <C,,cs > 满足 下 面 的 空间 分 划 约 来 (space-partition constraint) : 

o 对 于 所 有 满足 下 列 条 件 的 Zo hh i AZ BY i: 

1) Byi, +b, 20 

2) Bi, +b, 20 

3) Fii +f, = Fin th 

Cyi +C1 = Czis +6, 一 定 成 立 。 

并 行 化 算法 的 目标 是 为 每 个 语句 找 出 满足 这 些 约束 的 具有 最 高 秩 的 分 划 。 

图 11-25 中 的 图 说 明了 空间 分 划 约 束 的 本 质 。 假 设 有 两 个 静态 访问 分 别处 于 两 个 循环 嵌 套 结 
BH, 它们 的 下 标 向 量 分 别 为 i 和 疡 。 假 设 它们 共同 访问 了 至 少 一 个 数组 元 素 , 且 至 少 其 中 之 一 
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是 写 运算 , 那么 它们 之 间 有 具有 依赖 关系 。 根 据 仿 射 访 问 函 数 ii +f, M Fih +f,, 该 图 显示 了 在 


这 两 个 循环 中 恰巧 访问 同一 个 数组 
元 素 的 动态 访问 。 除 非 这 两 个 静态 

















访问 的 仿 射 分 划 Cyi; +0, A Cis + i 
c, 把 它们 的 动态 访问 分 配 到 同一 个 

处 理 器 上 ,否则 不 同 处 理 器 之 间 必 P 
须 进 行 同步 。 
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如 果 我 们 选择 一 个 仿 射 分 划 ， i, 


C O 























它 的 秩 为 所 有 语句 的 秩 的 最 大 值 ， 
-那么 就 得 到 了 最 大 可 能 的 并 行 性 。 
但 是 , 在 这 种 划分 下 , 有 些 处 理 器 
有 了 时 可 能 会 空闲 ， 而 其 他 处 理 器 却 
从 于 执行 那些 具有 较 小 秩 的 仿 射 分 
划 的 语句 。 如 果 执 行 这 些 语句 的 时 





口 口误 
OOD 
口 L 

] [ 口 数组 
口 口 
Dog 
Gaag 


处 理 器 ID 


图 11-25 ”空间 分 划 约 束 


间 相 对 较 短 ， 这 种 情况 还 是 可 接受 的 。 否 则 , 我 们 可 以 选择 穆 小 于 最 大 可 能 值 的 仿 射 分 划 ， 只 要 


这 个 分 划 的 秩 大 于 0 即 可 。 


在 例 11.41 中 , 我 们 给 出 了 一 个 用 于 说 明 这 个 技术 的 功能 的 小 程序 。 实 际 应 用 通常 要 比 这 个 
程序 简单 ,但 是 它们 的 边界 条 件 可 能 和 这 里 显示 的 一 些 问题 类 似 。 我 们 将 在 本 章 的 各 个 部 分 使 
用 这 个 例子 来 说 明 下 面 的 事实 : 具有 仿 射 访问 的 程序 具有 相对 简单 的 空间 分 划 约 束 , 这 些 约束 可 
以 通过 标准 线性 代数 技术 来 解决 , 并 且 最 终 需 要 的 SPMD 程序 能 够 从 仿 射 分 划 中 机 械 化 地 生成 。 








这 个 例子 说 明了 我 们 如 何 把 一 个 程序 的 空间 分 划 约 束 用 公式 表达 出 来 。 这 个 程序 显 


示 在 图 11-26 中 , 它 由 具有 两 个 语句 st 和 ss 的 小 循环 拭 套 结构 组 成 。 





for (i = 1; i <= 100; i++) 


} 





for (j = 1; j <= 100; j++) { 
XCi,j] = XCi,j] + YCi-1,j];  /* (st) */ 
Y[i,j] = Y[i,j] + XCi,j-4]; /* (s2) */ 








图 11.26 ”一 个 用 以 说 明 相 互 依赖 的 长 运算 链 的 循环 嵌 套 结构 


我 们 在 图 11-27 中 显示 了 程序 中 的 数据 依赖 
关系 。 在 图 中 ,每 个 黑 点 表示 语句 s 的 一 个 实 
GN, 而 每 个 白 点 表示 了 语句 sz 的 一 个 实例 。 在 坐 
标 (i,j) 处 的 点 表示 该 语句 在 下 标 变 量 的 取 值 为 
(7 时 的 实例 。 但 是 请 注意 , so 的 实例 位 于 对 应 
于 相同 (i)j) 对 的 s| 的 实例 的 下 方 , 因此 图 中 对 应 
于 j 的 垂直 刻度 要 比 对 应 于 i 的 水 平 刻 度 长 。 

请 注意 , Xi] s, GJ) SAWN, si (iJ) 
就 是 语句 s, 对 应 于 循环 下 标 值 i 和 和 j 的 实例 。 之 
EEH s (i,j+1) 读 出 ， 因 此 sj (i) DT s (Ci, 
j+1) 之 前 执行 。 这 个 事实 解释 了 图 中 从 黑 点 到 


白 点 的 垂直 箭 涉 。 类 似 地 , Yi Jla s (iJ) 写 人 再 








图 11-27 例 11.41 的 代码 中 的 依赖 关系 
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由 si1(it1)]) 读 出 ,这 个 事实 解释 了 从 白 点 到 黑 点 的 第 头 。 

从 图 中 很 容易 看 出 ,代码 可 以 被 并 行 化 为 无 同步 关系 的 儿 个 部 分 , 方法 是 把 各 个 相互 依赖 的 
运算 链 分 配给 同一 个 处 理 器 。 但 是 ,， 写 出 一 个 实现 这 样 的 映射 方案 的 SPMD 程序 并 不 容易 。 在 原 
来 的 程序 中 每 个 循环 有 100 Ak, 因此 存在 200 个 运算 链 。 在 这 些 运 算 链 中 ,其 中 的 一 半 由 s 
开始 并 以 si AAR, 另 一 半 从 sz 开始 并 以 ss 结束 。 这 些 链 的 长 度 从 1 ~ 100 个 和 迭代 不 等 。 

因为 有 两 个 语句 ， 所 以 我 们 需要 为 每 个 语句 寻找 一 个 仿 射 分 划 。 我 们 只 需要 表示 出 一 维 仿 
射 分 划 的 空间 分 划 约 束 。 这 些 约束 稍 后 将 由 试图 寻找 所 有 独立 的 一 维 仿 射 分 划 的 解 方法 所 使 用 。 
这 个 方法 还 将 把 这 些 一 维 分 划 组 合 起 来 得 到 多 维 仿 射 分 划 。 内 此 , 我 们 可 以 把 每 个 语句 的 仿 射 
分 划 表 示 为 一 个 1 x2 的 矩阵 和 一 个 1 x1 的 向 量 , 并 把 下 标 向 量 [i, 首 转换 成 为 一 个 处 理 器 的 编 
Ho SS (Cy Cy) fe} >，<[C2Cz] ,Lc2] > 分 别 为 语句 s 和 ss 的 一 维 仿 射 分 划 。 

我 们 将 应 用 六 个 数据 依赖 测试 : 

1) 语句 si 中 的 写 访问 X[i,j 和 其 自身 之 间 的 依赖 关系 。 

2) 语句 si 中 的 写 访问 X[i, 让 和 读 访问 X[i, 站 之 间 的 依赖 关系 。 

3) 语句 si PHSB Xi, JAA sz 中 的 读 访 问 X[i,j-1] 之 间 的 依赖 关系 。 

4) 语句 s 中 的 写 访问 YL i, 站 和 其 自身 之 间 的 依赖 关系 。 

5) 语句 s 中 的 写 访问 Y[i,)j 和 读 访 问 Y[ i, 站 之 间 的 依赖 关系 。 

6) 语句 ss PHEW Yi j AEA s 中 的 写 访问 YLi--1, 中 之 间 的 依赖 关系 。 

我 们 可 以 看 到 , 这 些 依赖 关系 测试 都 很 简单 ， 而 且 高 度 重复 。 这 个 代码 中 出 现 的 依赖 关系 发 
EERO) A PUA Xi, JA Xi, 7-1 RAZR (6) A Fila Yi, j) Yei 
-1, jj) HOSE HZ lal, 

由 语句 si PAY Xi, JIA sa 中 的 X[i,j-1] 之 间 的 数据 依赖 关系 而 导致 的 空间 分 划 约 束 可 以 
表示 成 下 列 各 项 : 

对 于 所 有 满足 下 面条 件 的 (i,j) 和 (2 ,7) 

1<i<100 1<j <100 
1 <i e100 1<7 <100 





i=7 了 = 了 -1 
我 们 有 
[Cu Cn] L] +[e,] = [Cy Cy] P t[e] 

也 就 是 说 , HOVER EDLC i, , J AFANAR E AEREA R, 后 两 个 条 
FERAS Xim Xij- th Be] — PB oR BENT A ASS MD SB St OM TD 
sy PRD YLi-1,/] ANAS si 中 的 访问 YU, J] aS AR d 
11.7.4 求解 空间 分 划 约 束 

一 旦 抽取 得 到 空间 分 划 约 束 之 后 , 我 们 就 可 以 使 用 标准 线性 代数 技术 来 寻找 满足 这 个 约束 
的 仿 射 分 划 。 让 我 们 首先 说 明 如 何 找 出 例 11. 41 的 解 。 

SMMC 我 们 可 以 使 用 下 面 的 步 又 来 找 出 例 11. 41 的 仿 射 分 划 : 

1) 建立 例 11. 41 中 显示 的 空间 分 划 约 束 。 我 们 在 决定 数据 依赖 关系 的 时 候 使 用 了 循环 界限 ， 
但 是 在 算法 的 其 余部 分 不 再 使 用 循环 界限 。 

2) 在 不 等 式 中 的 未 知 变量 是 ix RA ys Cii 、 Ci2、 Ci, Czy ` Coy 和 C20 根据 访问 函数 可 得 到 
SER =i 和 /= 六 -1。 使 用 这 些 等 式 来 减少 未 知 量 的 数目 。 我 们 使 用 高 斯 消除 法 来 完成 这 个 工 
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E, 它 把 四 个 变量 减少 为 两 个 变量 , 也 就 是 说 41 =i= 六 和 霹 =j= 广 -1。 分 划 的 等 式 变 为 





t 
[Cy -Ca Cy -Cal +[e, -c2 -C ] =0 
2 
3) 上 面 的 等 式 对 于 所 有 的 二 和 组 合 都 成 立 。 因 此 必然 有 下 面 的 结论 ， 
Cu — Cy, =0 
Ciz -Cu =0 


cy >62 - Cy =0 
如 果 我 们 对 访问 Y[i-1, 站 和 YIi, 站 之 间 的 约束 执行 同样 的 处 理 步 又 , 我 们 得 到 
Cy, - Cy, =0 
Cy. — Cy =0 
c1 =63 + Cy, =0 
把 所 有 这 些 约束 一 起 进行 简化 , 我 们 得 到 下 面 的 关系 : 
Cy, = Og = -Cn = -Cp Hey 一 ci 
4) 找 出 那些 只 涉及 系数 矩阵 中 的 未 知 量 的 等 式 的 所 有 独立 解 。 在 这 一 步 中 忽略 常量 向 量 中 
的 未 知 量 。 在 系数 矩阵 中 只 有 一 个 独立 的 选择 ,因此 我 们 寻找 的 仿 射 分 划 的 秩 最 多 为 一 。 为 了 
使 得 分 划 尽 量 简单 , 我 们 把 Cu 设置 为 ] 。 我 们 不 能 把 0 赋值 给 Cu ,因为 这 会 建立 一 个 零 秩 的 系 
数 和 矩阵 。 零 秩 失 阵 会 把 所 有 的 迁 代 都 映射 到 同一 个 处 理 器 上 。 由 Ci = 1 可 得 Cz =1，C2 = -1, 
C12= -1。 
5) 找 出 常数 项 。 我 们 知道 常数 项 之 间 的 差 c; -cl 必须 是 -1。 但 是 我 们 必须 选择 实际 的 值 。 
为 了 使 分 划 简 单 , 我 们 选择 cx =0, 因此 cf = -1。 
S p 为 执行 迭代 (i,j) 的 处 理 器 的 ID。 这 个 仿 射 分 划 用 P 表示 就 是 


s:[p] =U -+r -1 





也 就 是 说 ,si 的 第 〈i 六 个 迭代 被 分 配给 处 理 器 p =; -7 -1; 而 ss AUB) ERR 
处 理 器 p =i —jo 口 
找 出 一 个 程序 的 具有 最 高 秩 的 无 同步 仿 射 分 划 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 : 一 个 分 划 。 

方法 : 执行 下 列 步骤: 

1) 找 出 程序 中 所 有 的 具有 数据 依赖 关系 的 访问 对 。 对 于 每 一 对 具有 数据 依赖 关系 的 访问 ; 
BETEA di 中 的 语句 si 的 访问 A = < Ffi, B bi > MECH dy 中 的 语句 s, 的 访问 
Gy = <Fy fy By by >。 令 <Ciscl > 和 <C;,cs> 分 别 是 语句 % Als, 的 (当前 未 知 的 ) 分 划 。 相 
应 的 空间 分 划 约 束 表明 对 于 分 别处 于 各 自 德 环 界限 中 的 二 Ai), WR 

Fii + 万 =F yi, +f, 
那么 
Cii +c =Ci +e, 


我 们 将 扩展 迭代 的 域 , 使 之 包含 Z4 中 的 所 有 去 MZ PATA io CREN, 假设 所 有 的 界限 都 
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是 从 负 无 穷 大 到 正 无 穷 大 。 这 样 的 假设 是 有 道理 的 ,因为 一 个 仿 射 分 划 不 能 利用 如 下 的 性 质 : 一 
个 下 标 变量 的 取 值 范围 是 一 个 有 限 整 数 集合 。 

2) 对 于 每 一 对 相互 依赖 的 访问 , 我们 减少 其 下 标 向 量 中 的 未 知 基 的 数目 。 

© 请 注意 Fi +f 和 向 量 


alt 


相同 。 也 就 是 说 , 通过 在 列 向 量 的 底部 加 上 一 个 额外 的 分 量 1, RATT LA ed E S AA 
KIDE F PARAI 这 样 ， 可 以 把 访问 函数 的 等 式 Fi +f; =F yi, +h 改写 为 
i 
[F,-F, (fi -f2)]) i | =0 
1 

© 一 般 来 说 , 上 面 的 等 式 具有 多 个 解 。 但 是 , 我 们 仍然 可 以 使 用 高 斯 消除 法 尽 可 能 地 求解 
这 个 关于 分 量 i Mi, 的 方程 组 。 也 就 是 说 , 尽量 多 地 消除 变量 , ABR TEAN RE EA 
止 。 最 后 得 到 的 ii Mi, 的 解 将 具有 如 下 形式 














i ; 
i =0| | 
1 


EH UAB} SATE AE, ! 是 -- 个 由 取 值 范围 为 所 有 整数 的 自由 变量 组 成 的 向 量 。 
© 我 们 可 以 使 用 步骤 2@ 中 的 技巧 来 改写 关于 分 划 的 等 式 。 用 步 又 2@@ 的 结果 替代 向 量 
Cig ,1) ,我 们 可 以 把 关于 分 划 的 约束 写成 


[C,-C, (ci -eolo[] =0 


3) 舍弃 和 分 划 无 关 的 变量 。 上 面 的 等 式 对 所 有 的 上 都 成 立 的 条 件 是 
[C,-C, (e,-¢,)]U=0 
把 这 些 等 式 改 写成 4x =4 的 形式 , 其 中 x 是 一 个 由 仿 射 分 划 的 所 有 未 知 系数 组 成 的 向 量 。 
4) 找 出 这 个 仿 射 分 划 的 秩 并 求解 系数 矩阵 。 因 为 一 个 仿 射 分 划 的 秩 和 分 划 中 常量 项 的 值 无 
K, 所 以 消除 所 有 来 自 于 ci 和 cs 等 常量 向 量 的 未 知 量 , 从 而 把 Ax =0 替换 为 经 过 简化 的 约束 
A'x' =0 。 找 出 4'x' =0 的 解 , 并 把 它们 表示 为 B8, 也 就 是 可 以 生成 4' 的 零 空间 的 一 组 基本 向 量 


的 集合 。 
5) 找 出 常量 项 。 从 B 中 的 每 个 基本 向 量 中 得 到 所 求 仿 射 分 划 的 一 行 , 并 使 用 Ax =0 来 获得 
常量 项 。 口 


请 注意 , 步骤 3 忽略 了 因 循 环 界限 而 加 在 变量 + 上 的 约束 。 由 此 而 得 到 的 仿 射 分 划 约 束 会 更 
加 严格 ,因此 这 个 算法 一 定 是 安全 的 。 也 就 是 说 , 我 们 在 假设 1 可 取 任意 值 的 情况 下 生成 了 对 C 
和 < 的 约束 。 可 以 想象 , 如果 考虑 到 对 变量 上 的 约束 会 使 得 上 不 可 能 取 某 些 值 , 那么 可 能 还 会 存 
在 一 些 C Plc 的 其 他 解 。 没 有 搜寻 这 样 的 解 会 使 我 们 失去 一 些 优化 的 机 会 , 但 不 会 使 得 被 处 理 
的 程序 所 完成 工作 和 原 程序 不 同 。 
11.7.5 一 个 简单 的 代码 生成 算法 

算法 11. 43 生成 了 能 够 把 计算 任务 分 割 成 独立 分 划 单 元 的 仿 射 分 划 。 因 为 分 划 单 元 之 间 是 
相互 独立 的 , 因此 它们 可 以 被 任意 分 配 到 不 同 处 理 器 上 。 一 个 处 理 器 可 以 被 分 配给 多 个 分 划 单 
元 ,并 且 处 理 器 可 以 交替 执行 分 配给 它 的 分 划 单元 。 但 是 每 个 分 划 单 元 中 的 运算 需要 顺序 执行 ， 


ae 
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这 是 因为 它们 之 间 通 常 具有 数据 依赖 关系 。 

为 一 个 给 定 的 仿 射 分 划 生 成 一 个 正确 的 程序 相对 容易 一 些 。 我 们 首先 介绍 算法 11. 45。 
这 是 一 个 简单 的 代码 生成 方法 ， 它 能 够 为 单 处 理 器 系统 生成 顺序 地 执行 各 个 独立 分 划 单元 的 
代码 。 这 样 的 代码 优化 了 时 间 局 部 性 ,因为 对 相同 数组 元 素 的 多 次 数组 访问 在 时 间 上 相当 靠 
近 。 不 仅 如 此 , 这 个 代码 很 容易 被 转换 成 为 一 个 SPMD 程序 , 这 个 程序 在 不 同 的 处 理 器 上 执行 
各 个 分 划 单 元 。 遗 性 的 是 , 这样 生 成 的 代码 是 低 效 的 , 我 们 下 一 步 将 讨论 使 这 些 代码 高 效 执 
行 的 优化 方法 。 

我 们 的 基本 思想 如 下 。 我 们 已 经 知道 了 一 个 循环 嵌 套 结构 的 各 个 下 标 变量 的 界限 , 也 在 算 
法 11. 43 中 确定 了 某 个 语句 s 中 的 访问 的 分 划 。 假 设 我 们 希望 生成 一 个 能 够 顺序 执行 各 个 处 理 器 
上 的 动作 的 代码 , 那么 可 以 创建 一 个 最 外 层 的 循环 , 该 循环 遍历 各 个 处 理 器 ID 。 也 就 是 说 ,这 个 
循环 的 每 个 迭代 执行 了 分 配给 某 个 处 理 器 ID 的 运算 。 原 来 的 程序 作为 这 个 循环 的 循环 体 被 插 人 
到 代码 中 。 另 外 , 对 代码 中 的 每 个 运算 都 增加 了 一 个 测试 条 件 作 为 卫 式 ,以 保证 每 个 处 理 器 只 执 
行 赋予 它 的 运算 。 通 过 这 个 方法 , 我 们 保证 一 个 处 理 器 按照 原来 的 顺序 执行 了 所 有 赋予 它 的 
指令 。 
我 们 希望 生成 能 够 顺序 执行 例 11. 41 中 的 各 个 独立 分 划 单 元 的 代码 。 原 来 的 顺序 程 
序 来 自 图 11-26, 我 们 在 图 11-28 中 重复 这 段 





for (i = 1; i <= 100; i++) 
代码 。 for (j = 1; j <= 100; j+) { 
在 例 11.42 P, 仿 射 分 划算 法 找到 了 度 xfi,j = X[i,j + Y[i-1,jl; /* (st) */ 


Yfi,j] = YCi,j] + X[i,j-1]; /* (s2) */ 





数 为 一 的 并 行 性 。 因 此 , 处 理 器 空间 可 以 用 
单个 变量 p 表示 。 请 回忆 一 -下 , 我 们 在 那个 
例子 中 选择 了 如 下 的 仿 射 分 划 , 对 于 所 有 满 图 11-28 重复 图 11-26 
是 1<i<100 和 1<j<100 AY Pipe i A: 

1) 将 语句 si 的 实例 (i,j) 分 配给 处 理 器 p =i-j-1, 

2) 将 语句 sa 的 实例 (i,j) 分 配给 处 理 器 p =i~j。 

我 们 可 以 分 三 步 生 成 代码 : 

1) 对 于 每 个 语句 , 找 出 所 有 参与 该 语句 计算 的 处 理 器 的 ID, KRINHAR 1 <i<100 及 
1 <j 和 100 和 等 式 p =i-j-1 和 p=i-j 中 的 一 个 组 合 起 来 , 并 通过 投影 消除 i 和 j, 得 到 新 的 约束 。 

O 如 果 我 们 使 用 为 语句 s 得 到 的 函数 p =i-j -1, BAGS) -100<p<98, 

© 如 果 我 们 使 用 语句 s 的 函数 p =i -j, 那么 得 到 -99< p<99, 

2) 找 出 所 有 参与 了 任 一 语句 的 计算 工作 的 处 理 喘 的 DD。 我 们 取 这 些 范围 的 并 集 , 得 到 
-100s p<99, 这 些 界 限 足 以 覆盖 语句 s 和 ss 的 所 有 的 实例 。 

3) 生成 能 够 顺序 遍历 每 个 分 划 单元 中 的 计算 工作 的 代码 。 图 11-29 中 显示 的 代码 有 一 个 
外 层 循环 , 它 迭 代 遍 历 了 所 有 参与 计算 的 分 划 单 元 的 ID( 第 1 行 )。 在 第 2 行 和 第 3 行 , 每 个 
分 划 单 元 都 会 经 历 原 串 行程 序 生 成 所 有 迭代 下 标的 过 程 , 然后 它 可 以 选 出 应 该 由 处 理 器 p 执 
行 的 迭代 。 第 4 行 和 第 6 行 的 代码 保证 了 只 有 当 处 理 器 p 应 该 执行 语句 s Ms. 时 , 这 两 个 请 
名 才 可 以 执行 。 

虽然 生成 的 代码 是 正确 的 , 但 是 特别 低 效 。 首 先 , 虽然 每 个 处 理 器 最 多 执行 99 个 迭代 的 计 
算 任务 , 但 是 它 生成 了 100 x100 个 迭代 的 循环 下 标 值 ， 比 必须 的 下 标 值 数目 多 了 一 个 量 级 。 其 
次 ,最 内 层 循环 的 每 一 个 加 法 都 带 有 一 个 条 件 测 试 , 在 原 有 开销 上 又 增加 了 一 个 常量 因子 。 这 两 
种 低 效率 问题 的 处 理 将 分 别 在 11.7.6 节 和 11.7.7 节 中 处 理 。 口 
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1) for (p = -100; p <= 99; p++) 

2) for (i = 1; i <= 100; i++) 

3) for (j = 1; j <= 100; j++) { 

4) if (p == i-j-1) 

5) Xli, j] = X€i,j] + Y[i-1,j]; /* (s1) */ 
6) if (p == i-j) 

7) Yli, j] = X[i,j-1] + Y[i,j]; /* (s2) */ 
8) } 





图 11-29 图 11-28 中 的 代码 的 简单 改写 , ETEA T HAT N y hb BRE 25 fa] 


虽然 图 11-29 的 代码 看 起 来 被 设计 成 在 单 处 理 器 上 执行 的 代码 , 但 我 们 将 把 第 2 行 到 第 8 行 
的 内 层 循环 拿 出 来 在 200 个 不 同 的 处 理 器 上 执行 它们 。 每 个 处 理 器 都 有 一 个 不 同 的 从 - 100 ~ 99 
的 疡 值 。 只 要 我 们 安排 得 当 , 使 得 每 个 处 理 器 都 知道 各 自负 责 p 的 哪些 值 , 并 且 只 执行 对 应 于 这 
些 值 的 第 2 行 到 第 8 行 代 码 , 那么 就 可 以 在 少 于 200 个 处 理 器 上 分 划 内 层 循环 的 计算 。 
创建 顺序 执行 一 个 程序 的 各 个 分 划 单元 的 代码 。 

输入 : 一 个 具有 仿 射 数组 访问 的 程序 P。 程 序 中 的 每 个 语句 s 具有 形 如 Bi +b, 的 界限 ， 
其 中 i 是 s 所 在 循环 霸 套 结构 的 循环 下 标 变 量 的 向 量 。 每 个 语句 还 附 有 一 个 分 划 Csi + cs =p, 
其 中 pp 是 一 个 由 表 东 处 理 器 ID 的 变量 组 成 的 m 维 向 量 。m 是 程序 中 的 各 个 语句 的 分 划 的 秩 的 
最 大 值 。 

输出 : 一 个 等 从 于 P 的 程序 , 但 是 它 在 处 理 器 空间 上 (而 不 是 原来 的 循环 下 标 上 ) 进行 迭代 
遍历 。 

方法 : 执行 下 列 各 步 又: 

1) 对 于 每 个 语句 ,使 用 Fourier-Motzkin 消除 法 从 界限 中 通过 投影 消除 所 有 的 循环 下 标 变量 。 

2) 使 用 算法 11. 13 来 决定 分 划 单元 ID 的 界限 。 

3) 为 处 理 器 空间 的 m 个 维度 中 的 每 一 维 生 成 一 个 循环 。 令 p= [p1,p,，…,pa] 为 这 些 循环 
的 变量 的 向 量 。 也 就 是 说 , 对 于 处 理 器 空间 的 每 一 个 维度 都 有 一 个 变量 。 每 个 循环 变量 p; 遍历 
程序 P 中 所 有 语句 的 分 划 空 间 的 并 集 。 

请 注意 ,分 划 空 间 的 并 集 不 一 定 是 凸 的 。 为 了 保证 算法 简单 , 我 们 不 必 做 到 只 枚 举 那些 确实 
有 计算 任务 的 分 划 单 元 ; 我 们 可 以 把 每 个 p; 的 下 界 设置 为 由 各 个 语句 确定 的 全 部 下 界 的 最 小 值 ， 
并 把 每 个 p; 的 上 界 设置 为 由 各 个 语句 确定 的 全 部 上 界 的 最 大 值 。 因 此 p 的 某 些 取 值 可 能 没有 
运算 。 

由 每 个 分 划 单 元 执行 的 代码 就 是 原来 的 串 行程 序 。 但 每 个 语句 都 带 有 一 个 断言 作为 卫 式 条 
件 , 以 保证 只 有 属于 这 个 分 划 单 元 的 代码 才 会 被 执行 。 口 

我 们 很 快 就 会 给 出 算法 11. 45 的 一 个 例子 。 但 是 请 记 住 , 要 得 到 典型 例子 的 优化 代码 还 有 很 
多 工作 要 做 。 
11.7.6 消除 空 迭 代 

现在 我 们 讨论 生成 高 效 SPMD 代码 所 必须 的 两 个 转换 中 的 第 一 个 。 每 个 处 理 器 执行 的 代码 
循环 遍历 原 程序 中 的 所 有 迭代 , 并 选择 应 该 由 它 执行 的 运算 。 如 果 代 码 具有 此 度 的 并 行 性 , A 
做 的 后 果 就 是 每 个 处 理 器 的 工作 量 增 大 了 个 数量 级 。 第 一 个 转换 的 目的 是 收 紧 循环 的 界限 以 
ERRIA SER. 

首先 我 们 逐条 考虑 程序 中 的 语句 。 由 一 个 分 划 单 元 执行 的 一 个 语句 的 选 代 空 间 是 原来 的 迭 
代 空 间 加 上 仿 射 分 划 给 出 的 约束 。 我 们 可 以 把 算法 11. 13 应 用 到 新 的 迭代 空间 , 为 每 个 语句 生成 
一 个 紧 致 的 界限 。 新 的 下 标 向 量 和 原 顺序 程序 的 下 标 向 量 类 似 , 但 加 上 了 处 理 器 ID 作为 最 外 层 
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的 下 标 。 请 注意 , 这 个 算法 会 为 每 个 下 标 生成 以 外 围 下 标 表示 的 紧 致 的 界限 。 
在 找到 不 同 语句 的 迭代 空间 之 后 , 我 们 按照 逐个 循环 的 方式 把 它们 组 合 起 来 ,使 得 下 标的 界 

限 为 各 个 语句 的 界限 的 并 集 。 如 下 面 的 例 11. 46 所 示 , 最 后 有 些 循环 可 能 只 有 一 个 迭代 , 我 们 可 

以 简单 地 消除 这 个 循环 , 并 直接 把 循环 下 标 设置 为 该 迭代 对 应 的 值 。 

OO 对 于 图 11-30a 中 的 循环 , 算法 11. 43 将 生成 仿 射 分 划 





si:p=1 

s2 P=] 
算法 11.45 将 生成 图 11-30b 中 的 代码 。 对 语句 si 应 用 算法 11. 13 得 到 界限 p<isp, Bli=p, 48 
似 地 , 这 个 算法 确定 对 于 语句 s 有 j=p。 这 样 我 们 就 得 到 了 图 11-30e 所 示 的 代码 。 对 变量 i 和 j 


















































的 传播 将 会 消除 不 必要 的 测试 而 得 到 图 11-30d 中 的 代码 。 口 
for (p=1; p<=N; p++) { 
for (i=1; i<=N; i++) 
if (p = i) 
: | i Y[i] = Z[i]; /* (s1) */ 
, for (i=1; i<=N; i++) . for (j=l; j<=N; j++) 
Y[i] = 2[i}; /* (s1) */ if (p == j 
for (j=1; j<=N; j++) xfil = J 
X[j] = Y[j]; /* (s2) */ } Pe a eee 
a) 初始 代码 b) 应 用 算法 11.45 后 得 到 的 代码 
for (p=1; p<=N; p++) { 
i= Pp; 
if (p == i) 
Y[i = Z[i]; /* (st) */ 
j=p; for (p=1; p<=N; p++) { 
if (p == j) Y[P] = z[p]; /* (s1) */ 
X[j] = Y[j]; /* (s2) */ X[p] = Yip]; /* (s2) */ 
} } 
c) 应 用 算法 11.13 后 得 到 的 代码 d) 最 终 的 代码 
图 11-30 例 11.46 的 代码 





现在 我 们 回 到 例 11. 44, 并 说 明 把 不 同 语句 的 多 个 迭代 空间 合并 到 一 起 的 步 又 。 
到 现在 让 我 们 收 紧 例 11. 44 中 代码 的 循环 界限 。 由 分 划 单 元 p 执行 的 语句 si 的 迭代 空 
间 由 下 面 的 等 式 和 不 等 式 定义 : 
-100<p<99 
1<i:<100 
1<j<100 
i-p-l=j 
对 上 面 的 算式 应 用 算法 11. 13 生成 了 图 11-31a 中 显示 的 约束 。 算 法 11. 13 根据 i-p-1=j 
Al 1 <j<100 生成 约束 p+2<i<100 +p+1, 并 把 p 的 上 界 收 紧 为 98。 类 似 地 ,对 于 语句 s 的 各 
个 变量 的 界限 在 图 11-31b 中 显示 。 
图 11-31 中 语句 s 和 s, 的 迭代 空间 是 相似 的 , 但 是 如 图 11-27 中 所 期 望 的 , 两 个 空间 在 某 些 界 
限 上 相差 1。 图 11-32 中 的 代码 在 这 两 个 迭代 空间 的 并 集 上 运行 。 比 如 , 使 用 max(1,p +1) 作 为 的 
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下 界 ,min(100,100 +p +1) 作 为 其 上 界 。 请 注意 ,最 内 层 循环 在 第 一 次 和 最 后 一 次 执行 时 只 有 一 个 
BER, 而 在 其 他 情况 下 有 两 个 迄 代 。 生 成 循环 下 标的 开销 因此 降低 了 一 个 数量 级 。 因 为 被 执行 的 和 
REIHE s: 和 s 的 迭代 空间 都 大 ,在 执行 这 些 语句 的 时 候 仍然 需要 使 用 条 件 判 断 来 进行 选择 。 口 























j: i-p-1 < j < i-p-l j: i-p < j < i-p 
1< j < 100 1 < j < 100 

i: p+2 < i < 1l00+p+1 i: p+1 < t < 100+p 
l1 <x i <x 100 t < i < 100 

p: -100 < p < 98 p: -9 < p < 99 
a) 语句 $s 的 界限 b) 语句 ,的 界限 


图 11.31 图 11.29 中 p、i 和 j 的 较 紧 臻 的 界限 


11.7.7 从 最 内 层 循环 中 消除 条 件 测试 

第 二 个 转换 是 从 内 层 循环 中 消除 条 件 测 试 。 如 上 面 的 例子 所 示 , 如 果 循 环 中 各 个 语句 的 迭 
代 空 间 相交 但 是 不 重合 ， 就 需要 保留 条 件 测 试 语 句 。 为 了 消除 对 条 件 测试 的 需求 , 我 们 把 迭代 空 
间 分 割 成 为 子 空 间 , 每 个 子 空间 执行 同样 的 语句 集 合 。 这 个 优化 过 程 要 求 复制 代码 ， 且 只 应 该 用 
于 消除 内 层 循环 的 条 件 测试 。 

为 了 分 割 一 个 选 代 空间 以 消除 内 层 循环 的 条 件 测 试 , 我 们 重复 应 用 下 烈 步骤 直到 消除 内 层 
循环 中 的 所 有 条 件 测试 ; 

1) 选择 一 个 由 界限 不 同 的 多 个 语句 组 成 的 循环 。 

2) 使 用 一 个 条 件 来 分 割 循 环 , 使 得 某 个 语句 从 至 少 一 个 分 循环 中 被 剔除 。 我 们 从 相互 重要 
的 不 同 多 面体 的 边界 中 选择 这 个 条 件 。 如 果 某 个 语句 的 所 有 迭代 都 只 位 于 这 个 条 件 的 某 个 半 个 
平面 中 , 那么 这 个 条 件 就 是 有 用 的 。 

3) 为 每 一 个 迭代 空间 生成 代码 。 

URE 让 我 们 从 图 11-32 的 代码 中 删除 条 件 测试 。 除 了 在 两 端的 边界 分 划 单 元 , 语句 
51 All s2 被 映射 到 同一 个 分 划 单 元 — 




















n Pay = for (p = -100; p <= 99; p++) 
ID, Alt, 我 们 把 分 划 空 间 分 成 三 | to ae G = a T i <= min(100,101+p); i++) 
个 子 空间 : for (j = max(1,i-p-1); j <= min(100,i-p); j++) { 
a if (p == i-j-1) 
1) p= -100 i X[i, j] = Xli, j] + YLi-1,j]; /* (st) */ 
2) -99<p<98 if (p == i-j) 
= Y{i,j] = X[i,j-1] + Y[i,j]; /* (s2) */ 
3) p=99 ; 
然后 , 就 可 以 针对 每 个 子 空间 
中 所 包含 的 p 的 值 对 它 的 代码 进行 图 11-32 通过 收 紧 循 环 界限 进行 收 进 之 后 的 
特 化 。 图 11-33 Pika Tix = Pik 图 11-29 的 代码 
代 空 间 的 代码 。 


请 注意 , 第 一 个 和 第 三 个 空间 不 需要 i 或 j 的 循环 , 因为 定义 这 两 个 空间 的 p 值 是 确定 的 ,这 
些 循环 都 是 退化 的 , 它们 只 有 一 个 迭代 。 比 如 , 在 空间 1 中 , 在 循环 界限 中 把 p 替换 为 - 100 会 
把 i 限制 为 1, 从 而 把 j 限 定 为 100。 在 空间 1 和 3 中 对 p 的 赋值 显然 是 死 代码 , 因此 可 以 被 消除 。 

下 面 我 们 在 空间 2 中 分 割 下 标 为 ;的 循环 。 循 环 下 标 : 的 第 一 次 和 最 后 一 次 迭代 是 不 同 的 。 
因此 , 我 们 把 这 个 循环 分 割 为 三 个 子 空间 
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1) max(1,p+1) <i<p+2, 其 中 只 有 s, 被 执行 。 

2) max(1,p +2) <i<min(100,100+p), EF s, 和 ss 都 被 执行 。 

3) 101 +p<i<min(101 +p,100), 其 中 只 有 si 被 执行 。 

图 11-33 中 第 二 个 空间 的 循环 巷 套 因此 可 以 被 写成 图 11-34a 所 示 的 代码 。 

图 11-34b 显示 了 经 过 优化 的 程序 。 我 们 已 经 用 图 11-34a 替换 了 图 11-33 中 相应 的 循环 迭代 
结构 。 我 们 也 已 经 把 对 pi 和 j 的 赋值 传播 到 数组 访问 中 。 当 在 中 间 代 码 层 次 上 进行 优化 时 ,其 








中 的 一 些 赋值 会 被 识别 为 公共 子 表达 式 , 并 从 数组 访问 代码 中 重新 抽取 出 来 。 口 
/* 空间 (1) */ 
p = -100; 
i= 1; 
j = 100; 


X[i,j] = X[i,j] + YCi-1,j]; /* (s1) */ 


/* 空间 (2) */ 
for (p = -99; p <= 98; p++) : 
for (i = max(1,p+1); i <= min(100,101+p); i++) 
for (j = max(1,i-p-1); j <= min(100,i-p); j++) { 
if (p == i-j-1) 
X[i,j] = X[i,j] + Y[i-1,j]l; /* (s1) */ 
if (p == i-j) 
Y[i,j] = X[i,j-1] + Y[i,j]; /* (s2) */ 


} 
/* 空间 (3) */ 
p = 99; 
i = 100; 
jr; 


Y[i,j] = X[i,j-1] + YCi,j]; /* (s2) */ 














图 11-33 根据 p AUS HITE (NSS H 





/* 空间 (2) */ 
for (p = -99; p <= 98; p++) { 
/* 空间 (2a) */ 


if (p >= 0) { 
i = pti; 
j=l; 


Y[i,j] = XLi,j-1] + YCi,j]; /* (s2) */ 
} 
/* 空间 (2b) */ 
for (i = max(1,p+2); i <= min(100,100+p); i++) { 


j = i-p-1; 
X[i,j] = X[i,j] + Y[i-1,j]; /* (s1) */ 
j = i-p; 


YCi,j] = XCi,j-1] + Y[i,j]; /* (s2) */ 
} 
/* 空间 (2c) */ 
if (p <= -1) { 

i = 101+p; 

j = 100; 

x[i, j] = X[i,j] + Y[i-1,j]; /* (s1) */ 








a) 根据 :的 值 分 割 空间 (2) 
图 11-34 例 11.48 的 代码 
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/* 空间 (1); p= -100 */ 
X{1,100] = X[1,100] + Y[0,100]; /* (81) */ 
/* 空间 (2) */ 
for (p = -99; p <= 98; p++) { 
if (p >= 0) 
Y[p+1,1] = X[p+1,0] + Y[pti,1]; /* (52) */ 
for (i = max(1,p+2); i <= min(100,100+p); i++) { 
X(i,i-p-1] = X[i,i-p-1] + Y[i-1,i-p-1]; /* (s1) */ 
Y(i,i-p] = X[i,i-p-1] + Y[i,i-pl; /* (82) */ 
} 
if (p <= -1) 
X(101+p,100] = X[101+p,100] + Y(101+p-1,100]; /* (s1) */ 
} 
/* 空间 (3); p = 99 */ 
¥[100,1] = X[100,0] + ¥[100,1]; /* ($2) */ 














b) 和 图 11-28 等 价 的 优化 代码 


图 11.34 ( 续 ) 


11.7.8 源 代码 转换 

我 们 已 经 看 到 如 何 根 据 各 个 语句 的 简单 仿 射 分 划 得 到 和 原来 的 源 代码 明显 不 同 的 程序 。 但 
E, 至 今 为 止 看 到 的 例子 中 都 没有 明确 显示 出 仿 射 分 划 是 如 何 与 源 代码 层次 上 的 改变 联系 起 来 
的 。 本 节 将 说 明 , 通过 把 仿 射 变换 分 解 成 为 一 系列 基本 变换 , 我 们 可 以 相对 容易 地 论证 对 源 代码 
的 修改 。 

七 个 基本 仿 射 转换 

每 个 仿 射 分 划 可 以 表示 为 一 个 由 的 基本 仿 射 转换 组 成 的 序列 。 每 个 基本 仿 射 转换 对 应 于 源 
代码 层次 上 的 一 个 简单 改变 。 总 共有 七 个 基本 仿 射 转换 : 前 四 个 基本 转换 在 图 11-35 中 说 明 , 后 
三 个 转换 被 称 为 么 模 转 换 (unimodular transform) , 在 图 11-36 中 解释 。 

图 中 给 出 了 每 个 基本 转换 的 一 个 例子 : 一 个 源 代码 、 一 个 仿 射 分 划 和 一 个 结果 代码 。 我 们 也 
画 出 了 转换 之 前 和 之 后 的 代码 中 的 数据 依赖 关系 。 在 数据 依赖 关系 图 中 , 我 们 看 到 每 个 基本 转 
换 对 应 于 一 个 简单 的 几何 转换 ， 对 应 于 一 个 简单 的 代码 转换 。 这 七 个 基本 转换 为 : 

1) 融合 (fusion) 。 融 合 转换 的 特点 是 把 原 程序 中 的 多 个 循环 下 标 映射 到 同一 个 循环 下 标 上 。 
新 的 循环 融合 了 来 自 不 同 循环 的 语句 。 

2) 裂变 (fission)。 殊 变 转换 是 融合 的 逆向 转换 。 它 把 不 同 语句 的 同一 个 循环 下 标 映 射 到 转 
换 得 到 的 代码 中 的 不 同 循环 下 标 。 这 个 转换 把 原来 的 一 个 循环 分 解 为 多 个 循环 。 

3) 重新 索引 (re-indexing) 。 重 新 索引 技术 把 一 个 语句 的 动态 执行 偏 移 固 定 多 个 迭代 。 这 个 
仿 射 变换 有 一 个 常量 项 。 

4) 比例 变换 (scaling) 。 源 程序 中 的 连续 和 迭代 被 一 个 常量 因子 隔 开 。 这 个 仿 射 变换 具有 一 个 
正 的 非 单元 系数 。 

5) 反 置 (reversal)。 按 照相 反 顺 序 执行 循环 中 的 迭代 。 反 置 转换 的 特点 是 有 一 个 系数 为 -1。 

6) 交换 (permutation ) 。 交 换 内 层 循环 和 外 层 循 环 。 这 个 仿 射 变换 由 单位 矩阵 中 的 经 过 交换 
的 各 行 组 成 。 

7) 倾斜 (skewing)。 沿 着 一 个 角度 来 遍历 循环 的 迭代 空间 。 这 个 仿 射 变换 是 一 个 么 模 矩 阵 ， 
其 对 角 线 上 都 是 1。 
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源 代 码 分 划 转换 后 的 代码 
for (i=1; i<=N; i++) for (p=1; p<=N; p++){ 
Y[i] = Z[i]; /*s1*/ Y(p] = Z[p]; 
for (j=1; j<=N; j++) 融合 X(p] = Y[p]; 


X[j] = Y[j]; /*s2*/ sip=i } 


SOOO 5 S2:p=j 
H y 





for (i=1; i<=N; i++) 


f =1; p<=N; p++){ 
or Ph HSN pE Y[i] = zli]; /*s1*/ 











Y[p] = Z[p]; ; : f 
X[p] = Y[p]; | RX for Alig j< Nie) 

} s.it=p X[j] = Y[j]; /*s2*/ 
ODO sı S2: j =p C 
ryti 
$ è 6 @6 $ 52 

nr reer 
if (N>=1) x[1]=Y[0]; 
for (i=1; i<=N; i++) { for (p=1; p<=N-1; p++){ 
Y[i = 204]; /xsly/ Y[p]=2[p]; 
x[i] = Y[i-1]; /*s2*/ 重新 索引 X[p+1]=Y[p]; 

Pe | Gabe nap 
ee Bee opi] if (N>=1) Y[N]=Z[N]; 
ii ~ Ai E was 000000 s 
S % k 32 4 lee 

ie ee eg s 





for (p=1; p<=2*N; p++){ 


for (i=1; i<=N; i++) 
if (p mod 2 == 0) 


Y[2*i] = Z[2*i]; /*s1i*/ 


for (j=1; j<=2*N; j++) aS Nt Y(p] = 2[p]; 
x[j]=Y[j]; /*s2*/ Bao ; X(p] = Yip]; 
CERON 31 (sg: p=) 090 O4 
\ aoa | i 
obed% » TETEE 














图 11-35 ”基本 仿 射 转换 ( 工 ) 





么 模 转 换 

一 个 么 模 转 换 仅 由 一 个 么 模 系 数 矩 阵 组 成 , 没有 常量 向 量 。 勾 模 矩 阵 是 一 个 正方 形 和 矩阵 ， 

其 行列 式 为 +1。 么 模 转换 的 重要 性 在 于 它 把 一 个 n 维 迭代 空间 映射 到 另 一 个 n 维 的 多 面体 ， 
并 且 两 个 空间 之 间 的 迭代 具有 一 一 对 应 关系 。 








并 行 化 的 几何 解释 

在 上 面 的 例子 中 , 除 裂 变 之 外 , 其 他 的 仿 射 转换 都 是 通过 把 无 同步 仿 射 分 划算 法 应 用 到 各 自 
的 源 代码 上 而 得 到 的 。( 下 一 节 中 将 讨论 如 何 把 裂变 转换 应 用 于 带 有 同步 的 代码 的 并 行 化 。) 在 每 
一 个 例子 中 , 生成 的 代码 有 一 个 (最 外 层 的 ) 可 并 行 化 循环 ,这 个 循环 的 各 个 选 代 可 以 分 配给 不 
同 的 处 理 器 , 并且 不 需要 同步 。 
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源 代 码 EE 转 挨 启 的 代 而 
for (i=0; i<=N; i++) As wd 
Y(N-i] = 2[i]; /*s1*/ set (p=0; Bee 
for (j=0; j<=N; j++) oo a = ZIN-P] ; 
XG] = YG]; /#s2#/ 反 置 O [p] = Y[p]; 
SI:p=N-i } 
QO9 Cf 0 1 (sg: p=J) OOOOOO0O s 
SE TETTO] 
A PI y 
SELVES 。 Perris 
f =O =M; 
for (i=1; i<=N; i++) ae o 
for (j=0; j<=M; j++), Zlq.p) = Z[q-1,p]; 
ZU, jl = 交换 ae ga Coe 
z{i-1, 3]; 














必然 低 于 180°, 但 是 不 4 
仿 射 转换 改变 了 和 迭代 的 顺序 , 使 得 只 有 最 外 层 循环 的 同一 迭代 之 内 的 运算 之 间 才 有 依赖 关 


for (i=1; 
for (j=max(1,i+N); 
j<=min(i,M); j++) 
Z[i,j] = 
Z(i-1,j-1]; 


i<=N+M-1; i++) 











for (p=1; p<=N; p++) 
for (q=1; q<=M; q++) 
Z(p,q-p] = 
Z(p-1,q-p-1]; 








QO 
Ot) 
Ome 








图 11-36 ”基本 仿 射 转换 ( 工 ) 


这 些 例子 说 明 可 以 使 用 几何 学 的 方法 来 简单 地 解释 并 行 化 技术 是 如 何 工作 的 。 依 赖 边 总 是 
从 一 个 较 早 的 实例 指向 较 晚 的 实例 。 因 此 , 嵌 套 在 不 同 循环 中 的 不 同 语句 之 间 的 依赖 关系 遵循 
程序 文本 中 的 顺序 ; 揪 套 在 同一 循环 中 的 语句 之 间 的 依赖 关系 遵循 词典 顺序 。 从 几何 学 角度 讲 ， 
一 个 二 维 循环 嵌 套 结构 的 依赖 关系 总 是 在 [0" ,180") 的 范围 之 内 ， 也 就 是 说 这 些 依 赖 关 系 的 角度 


AF 0° 


Ro WARM, 在 最 外 层 循环 的 选 代 边 界 上 没有 依赖 边 。 在 对 简单 的 源 代 码 进行 并 行 化 时 , 我 们 


可 以 画 出 它们 的 依赖 关系 , 并 用 几何 方法 找 出 这 样 的 转换 。 
11.7 节 的 练习 


11.7.9 


练习 11.7.1: 对 于 下 面 的 循环 


for (i = 2; i < 100; 
Alil = Ali-2); 


i++) 


1) 最 多 可 以 用 多 少 个 处 理 器 来 有 效 运 行 这 个 循环 ? 
2) 以 处 理 器 编号 p 作为 参数 改写 这 个 代码 。 

3) 给 出 这 个 循环 的 空间 分 划 约 束 , 并 找 出 这 个 约束 的 一 个 解 。 
4) 这 个 循环 的 具有 最 高 秩 的 仿 射 分 划 是 什么 ? 


540 Rus 





练习 11. 7.2: 对 于 图 11-37 PRIER EJ 11.7.1, 


for (i = 1; i <= 100; i++) 
for (j = 1; j <=.100; j++) 
for (k = 1; k <= 100; k++) { 
Ali, j,k] = ACi,j,k] + Bli-1,j,k]; 
Bli,j,k] = Bli,j,k] + Cfi,j-1,k]; 
for (i = 0; i <= 97; i++) cli,j,k] = Cli,j,k] + Ali,j,k-1); 
Ali] = A[i+2]; } 














b) 





for (i = 1; i <= 100; i++) 
for (j = 1; j <= 100; j++) 
for (k = 1; k <= 100; k++) { 
ACi,j,k] = ACi,j,k] + Bli-1,j,k]; 
B[i, j,k] = Bli,j,k] + Ali, j-t,k]; 
Cli,j,k] = Cli,j,k] + ACi,j,k-1] + B[i,j,k]; 
} 





c) 


图 11-37 练习 11.7.2 的 代码 
练习 11. 7. 3: 改写 下 面 的 代码 


for (i = 0; i < 100; i++) 


Ali] = 2*A[i]; 
for (j = 0; j < 100; j++) 
A[j] = ALj] + 1; 


使 得 新 代码 只 包含 一 个 循环 。 以 处 理 器 编号 p 为 下 标 改写 这 个 循环 , 使 得 代码 可 以 在 100 个 处 理 
器 之 间 分 配 , 其 中 第 p 个 迭代 由 处 理 妖 p 执行 。 
练习 11.7.4: 在 下 面 的 代码 中 
for (i = 1; i < 100; i++) 
for (j = 1; j < 100; j++) 
/* (s) */ ACi,j) =(ACi-1,j] + ACi+1,3) + ALi, j-1] + Ali, j+1])/4; 


WE — BY 2A SHE JE TE a PA i E TA A BE RITE A s UME EPA AT IAN 8 (i -1,7) Ml s(i,j-1), 
然后 执行 迭代 *(iy) 。 证 明 这 些 约 束 就 是 全 部 的 必要 约束 。 然 后 改写 代码 使 得 最 外 层 循环 的 下 
标 变 量 为 p, 并 且 所 有 满足 i+j =p 的 实例 s(i,j) 都 在 外 层 循 环 的 第 p MER EMT. 

练习 11. 7.5: 重复 练习 11.7.4, 但 是 重新 安排 执行 方案 , 使 得 * 的 满足 i -j=p 的 实例 在 外 
层 循 环 的 第 p 个 迭代 上 运行 。 

| 练习 11.7.6: 把 下 面 的 循环 


for (i = 0; i < 100; i++) 


Afi] = Bli]; 
for (j = 98; j >= 0; j = j-2) 
B[i] = i; 


合并 为 一 个 循环 ,要求 保 持 所 有 的 依赖 关系 。 
练习 11. 7.7: 证 明和 矩阵 
2 1 
Leal 


KHAN. HR FE — PERE A TA EK. 
练习 11.7.8: 对 下 面 的 矩阵 重复 练习 11.7.7. 


l sl 
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11.8 并行 循 环 之 间 的 同步 


如 果 我 们 不 允许 处 理 器 之 间 进 行 任何 同步 , 很 多 程序 就 没有 任何 并 行 性 。 但 是 通过 向 一 个 
程序 中 增加 少量 周 定 多 个 同步 运算 之 后 , 可 以 找到 更 多 的 并 行 性 。 在 本 节 中 , 我 们 将 首先 讨论 因 
为 引入 疾 定 多 个 同步 运算 而 获得 的 并 行 性 。 下 一 节 中 将 讨论 一 般 情况 ,， 即 把 同步 运算 嵌 人 到 循 
环 中 的 情况 。 

11. 8.1 固定 多 个 同步 运算 

没有 无 同步 并 行 性 的 程序 可 能 包含 一 系列 循环 。 如 果 独 立地 考虑 这 些 循环 , e 
环 是 可 以 并 行 化 的 。 我 们 可 以 在 这 些 循环 执行 之 前 和 之 后 引 和 人 同步 栅 障 ， 从 而 把 这 些 循环 并 行 
化 。 例 11.49 说 明了 这 一 点 。 

图 11-38 给 出 了 一 个 实现 了 ADI( 交 替 方 向 隐 式 方法 , 一 种 数值 计算 方法 ，Alternating 
Dirrection Implicit) 积分 算法 的 典型 程序 。 它 没有 无 
同步 并 行 性 。 在 第 一 个 循环 说 套 结构 中 的 依赖 关系 | for Ga Ac en 

要 求 每 个 处 理 器 在 数组 XX 的 一 列 上 工作 ; 但 是 在 第 XLi,j] = £(XCi,j) + XCi-1,j]); 
MERGING HO BR a ae | FO TA 

数组 区 的 一 行 上 工作 。 如 果 要 求 没 有 通信 运算 ,， 整 X[i,j] = g(Xli,j] + X[i,j-1]); 
个 数组 必须 放 在 同一 个 处 理 器 上 , 因此 不 存在 并 行 
性 。 但 是 , 我 们 观察 到 两 个 循环 都 是 可 以 单独 并 行 “图 1138 两 个 顺序 的 循环 谋 套 结构 
化 的 。 

并 行 化 代码 的 方法 之 一 是 在 第 一 个 循环 中 让 不 同 的 处 理 器 在 数组 的 不 同 列 上 工作 , 同步 并 
等 待 所 有 的 处 理 器 完成 任务 后 , 各 个 处 理 器 再 在 各 个 行 上 进行 运算 。 使 用 这 个 方法 ,只 需要 引 人 
一 个 同步 操作 就 可 以 使 算法 中 的 所 有 计算 都 被 并 行 化 。 但 是 , 我 们 注意 到 虽然 只 进行 了 一 次 同 
步 , 但 是 这 个 并 行 化 方案 要 求 几乎 所 有 的 矩阵 XX 中 的 数据 在 不 同 的 处 理 器 之 间 传 递 。 通 过 引入 
更 多 的 同步 计算 有 可 能 降低 通信 量 。 我 们 将 在 11. 9. 9 节 中 讨论 这 个 问题 。 口 

看 起 来 , 这 个 方法 可 能 只 适用 于 由 一 系列 循环 艇 套 组 成 的 程序 。 但 是 , 我 们 可 以 通过 代码 转 
换 创 造 出 更 多 的 优化 机 会 。 我 们 可 以 应 用 循环 裂变 转换 把 原 程 序 中 的 循环 分 解 成 为 几 个 较 小 的 
循环 。 利 用 同步 栅 障 把 它们 隔 开 , 然后 逐一 将 它们 并 行 化 。 我 们 用 例 11. 50 来 解释 这 个 技术 。 
B11. 50 考虑 下 面 的 循环 : 

for (i=i; i<=n; i++) { 

X[i] = Y[i] + 2(i); /* (si) */ 


W(A(i]] = x(il; /* (s2) */ 
} 


因为 不 知道 数组 4 中 的 值 , 我 们 必须 假设 语句 ss PROTA TSS W ATEL. A, 
sz 的 实例 的 执行 顺序 必须 和 它们 在 原 程序 中 的 顺序 一 致 。 

代码 中 没有 无 同步 的 并 行 性 , 算法 11.43 将 简  ， 
单 地 把 所 有 的 计算 任务 部 限 同 一 个 处 理 锋 。 但 是 ， | MLD TO BL fe C0 Y 
至 少 语句 sj 的 实例 可 以 并 行 执行 。 我 们 可 以 把 这 个 if (p == 0) 
代码 的 一 部 分 并 行 化 , 方法 是 让 不 同 的 处 理 器 执行 P a 
语句 si 的 不 同 实例 。 然 后 在 另 一 个 独立 的 顺序 循环 | | 
中 , 用 一 个 处 理 器 ( 比如 说 0 号 处 理 器 ) 执行 s,。 相 图 11-39 BI 11. 50 中 的 循环 的 SPMD 代码 ， 
应 的 SPMD 代码 显示 在 图 11-39 中 。 口 其 中 p 是 存放 处 理 器 ID 的 变量 
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11.8.2 程序 依赖 图 
为 了 找 出 所 有 可 以 通过 加 入 固定 多 个 同步 运算 而 变 得 可 用 的 并 行 性 , 我 们 可 以 尽 可 能 地 对 


为 了 揭示 出 所 有 可 以 进行 循环 裂变 的 机 会 , 我 们 使 用 程序 依赖 图 (Program Dependence 
Graph, PDG) 的 抽象 表示 方法 。 程 序 的 程序 依赖 图 中 的 各 个 结 点 是 程序 的 赋值 语句 , 图 中 的 边 表 
示 语 句 之 间 的 数据 依赖 关系 以 及 依赖 的 方向 。 只 要 语句 si 的 某 个 动态 实例 和 后 面 的 语句 s 的 一 
个 动态 实例 之 间 存 在 数据 依赖 关系 ， 就 存在 一 条 从 语句 5, 到 语句 s, 的 边 。 

构造 一 个 程序 的 PDG 时 , 我们 首先 找 出 每 一 对 语句 中 的 两 个 静态 访问 之 间 的 数据 依赖 关 
系 。 一 个 语句 对 中 的 两 个 语句 可 以 相同 , 这 两 个 静态 访问 也 可 以 相同 。 假 设 确定 了 语句 st 中 
的 访问 .到 和 语句 ss 中 的 访问 A 之 间 有 依赖 关系 。 请 注意 ,一 个 语句 的 实例 可 以 使 用 下 标 向 
量 1=[i,is,…,in] 来 刻画 , BP i, 是 该 语句 所 在 循环 府 套 结构 中 从 最 外 层 开始 的 第 个 循环 
的 下 标 。 

1) 如 果 有 两 个 语句 实例 ,si 的 实例 i 和 ss MISCHA, 它们 之 间 具 有 数据 依赖 关系 ,并且 在 
原 程序 中 , i, TE i 之 前 执行 , 记 作 了 <ni, 那么 有 一 条 从 s 到 ss 的 边 。 

2) 类 似 地 , 如 果 有 两 个 语句 实例 ,si 的 实例 ij Als, 的 实例 记 , 它们 之 间 具 有 数据 依赖 关系 ， 
记 作 in kasii, 那么 有 一 条 从 ss 到 si 的 边 。 

请 注意 , 有 可 能 根据 两 个 语句 s 和 s 之 间 的 数据 依赖 关系 , 在 PDC 中 既 生 成 了 从 si 到 so 
的 边 , 又 生成 了 从 ss 到 si 的 边 。 

在 语句 s! 和 ss 相同 的 特殊 情况 下 , i <,,,,is 当 且 仅 当 计 <i (BI iy 按照 词典 排序 比 i, 小 )。 
在 一 般 情 况 下 , s 和 s 可 以 是 不 同 的 语句 , 有 可 能 属于 不 同 的 循环 嵌 套 结构 。 

CS 对 于 例 11.50 中 的 程序 , 在 语句 si 的 实例 之 间 没 有 依赖 关系 。 但 是 , 语句 ss 的 第 i 
个 实例 必须 在 语句 si 的 第 ; 个 实例 之 后 发 生 。 更 糟糕 的 是 ,因为 数组 引 

用 W[A[ 洒 ] 可 以 对 数组 的 到 的 每 个 元 素 进行 写 运 算 ，s 的 第 i 个 实例 名 
依赖 于 所 有 之 前 的 s 的 实例 。 也 就 是 说 ,语句 s 依赖 于 它 本 身 。 例 CO 

11. 50 的 程序 的 PDG 显示 在 图 11-40 中 。 请 注意 图 中 有 一 个 只 包含 s。 图 1140 aa. 50 Hy 
的 环 。 程序 的 PDG 

程序 依赖 图 使 得 我 们 可 以 很 容易 地 确定 是 否 可 以 分 割 一 个 循环 中 ; 

的 多 个 语句 。 在 一 个 PDG 中 , 一 个 环 所 连接 的 各 个 语句 不 能 被 分 割 开 。 如 果 ss 是 一 个 环 中 
两 个 语句 之 间 的 依赖 关系 ,那么 s1 的 某 些 实例 必须 在 s 的 某 些 实例 之 后 发 生 , 反 过 来 也 成 立 。 
请 注意 , RAM s 和 sa 嵌入 在 同一 个 循环 中 的 时 候 才 可 能 有 这 种 相互 依赖 关系 。 因 为 有 这 种 相 
互 依赖 关系 , 我 们 不 能 先 执行 完 一 个 语句 的 所 有 实例 之 后 再 执行 另 一 个 语句 的 所 有 实例 , 因此 不 
允许 进行 循环 裂变 转换 。 另 一 方面 , 如 果 依 赖 关 系 ss 是 单 向 的 , 我们 就 可 以 对 这 个 循环 进行 
分 割 ,首先 执行 51 的 所 有 实例 ,然后 执行 ss 的 实例 。 
OMA 图 11-41b 显示 了 图 11-41a 中 程序 的 程序 依赖 图 。 图 中 语句 s Ms, 属于 一 个 环 , B 
此 不 能 被 放 到 不 同 的 循环 中 去 。 但 是 我 们 可 以 把 语句 ss 分 割 出 去 , 并 在 执行 其 他 计算 之 前 执行 
它 的 所 有 实例 , 如 图 11-42 所 示 。 第 一 个 循环 是 可 以 并 行 化 的 , 但 是 第 二 个 循环 不 能 被 并 行 化 。 
我 们 可 以 在 第 一 个 循环 的 并 行 执行 之 前 和 之 后 放 上 一 个 同步 李 障 ,从 而 把 第 一 个 循环 并 行 化 。 
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for (i = 0; i < n; i++) { 
z[i] = Z[i] / wal; /* (si) */ 
for (j = i; j < n; j++) { 
X[i,j] = Y[i,j]*Y[i,j]; /* (s2) */ 
Z[j] = Z0j] + xX[i,j]; /* (s3) */ 














a) 一 个 程序 b) 它 的 依赖 图 


图 11-41 例 11.5.2 的 程序 和 依赖 图 





for (i = 0; i < ni i++) 
for (j = i; j < n; j++) 
X[i,j] = Y[i,j]*Y[i,j]; /* (s2) */ 
for (i = 0; i < n; itt) { 


z[i] = Z[i] / wil; /* (si) */ 
for (j = i; j < n; j++) 





2(j] = 203] + X[i,j]; /* (s3) */ 
} ; 








图 11-42 对 一 个 循环 在 套 结构 的 强 连通 子 图 进行 分 组 


11. 8.3 层次 结构 化 的 时 间 

在 一 般 情 况 下 ,关系 <;,s, 的 计算 是 很 困难 的 。 但 是 对 于 某 些 类 型 的 程序 而 言 , 我 们 有 一 个 直 
接 的 方法 来 计算 这 种 依赖 关系 。 本 节 中 的 优化 技术 经 常 被 应 用 于 这 一 类 程序 。 假 设 这 个 程序 是 
块 结构 的 , 由 循环 和 简单 的 算术 运算 组 成 , 并 且 不 包含 其 他 控制 结构 。 该 程序 中 的 语句 要 么 是 一 
个 赋值 语句 , 要 么 是 一 个 语句 序列 , 要 么 是 一 个 其 循环 体 为 单个 语句 的 循环 结构 。 这 样 , 这 个 程 
序 的 控制 结构 就 形成 了 一 个 层次 结构 。 这 个 层次 结构 的 顶层 结 点 表示 对 应 于 整个 程序 的 语句 。 
单个 赋值 语句 是 一 个 叶子 结 点 。 如 果菜 语句 是 一 个 语句 序列 , 那么 它 的 子 结 点 就 是 该 序列 中 的 
语句 。 这 些 子 结 点 按照 语句 的 词典 排序 从 左 到 右 排列 。 如 果菜 语句 是 一 个 循环 结构 ,那么 它 的 
子 结 点 就 是 循环 体 对 应 的 子 图 , 通常 是 由 一 个 或 多 个 语句 组 成 的 序列 。 
DRR 11-43 中 程序 的 层次 结构 显示 在 图 11-44 中 。 热 行 序列 的 层次 结构 特性 在 图 11-45 
中 着 重 显示 。 语 句 so 的 唯一 实例 在 所 有 其 他 运算 之 前 一 一 











进行 , 因为 它 是 被 执行 的 第 一 个 语句 。 接 下 来 , 我 们 执 | ao yg 
行 来 自 外 层 循环 的 第 一 个 迭代 的 所 有 指令 , 然后 再 执行 s1; 
BOURGES, 这样 一 直 向 前 执行 。 对 于 循环 下 ibe ee 
标 i 的 值 为 0 的 所 有 动态 实例 , FEAT si. Ly, Ly 和 ss 按 
照 正 文 顺序 执行 。 我 们 可 以 重复 上 面 的 讨论 , 生成 执行 Le or TE 
顺序 的 其 他 部 分 。 口 te 

我 们 可 以 用 一 种 层次 结构 化 的 方式 来 解决 由 两 个 po 
不 同 语句 生成 的 两 个 实例 之 间 的 顺序 问题 。 如 果 两 个 
语句 处 于 同一 个 循环 中 , 我 们 从 最 外 层 循环 开始 比较 它 “图 11-43 一 个 按 层次 结构 组 织 的 程序 


们 的 共同 循环 的 下 标 变量 的 值 。 当 我 们 发 现 它们 的 某 个 下 标 具 有 不 同 值 时 , 这 个 差 值 就 决定 了 
它们 之 间 的 顺序 。 只 有 当 较 外 层 循环 的 下 标 值 都 相同 的 时 候 , 我 们 才 需 要 比较 下 一 个 内 层 循环 
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的 下 标 值 。 这 个 过 程 类 似 于 我 们 比较 以 小 时 /分 钟 / 秒 的 方式 所 表示 的 时 间 。 比 较 两 个 时 间 时 ， 
我 们 首先 比较 小 时 数 ,， 只 有 当 它 们 的 小 时 数 相 同 的 时 候 , 我 们 才 比 较 分 钟 ， 以 
此 类 推 。 如 果 所 有 公共 循环 的 下 标 值 都 相同 , 那么 我 们 根据 它 





Prog 
们 的 相对 正文 位 置 来 决定 它们 之 间 的 顺序 。 因 此 , 我 们 一 直 在 BF OX 
讨论 的 简单 嵌 套 循环 程序 的 执行 顺序 经 常 被 称 为 “层次 结构 a 
化 "的 时 间 。 aah 7 a 
Ss AMR EATERY d, 的 循环 中 的 语句 , 而 s RE IN 
在 深度 为 中 的 循环 中 , 它们 之 间 有 d 个 公共 (外 层 ) 循环 。 当 2 83 s4 
Wd<d, Hd<d,, BRis[i ig. iy IAs TEA, i ag 例 11.53 中 的 程序 
而 了 = [j dada, ] 为 52 的 一 个 实例 。 的 层次 结构 
ix, 当 且 仅 当 下 列 条 件 之 一 成 立 : 
1) [i ;12 < Jo Seja] ,或 者 
2) [iniz iia] = Ly Jae Jal 且 在 正文 上 si 出 现在 $2 > i=0 s 
之 前 。 3: Ly j=0 s 
BE lt sio tig] KL do. ig] TUS a RAE SE a jei i 
式 的 析 取 式 。 6 : 53 
(iy <j) Vy Sj Nig <j) VV 5; Tan kE bii 
(iy =j Ave Aia-1 ZjJa-1 ^ia <Ja) 9 : k=l s4 
只 要 数据 依赖 关系 的 条 件 和 上 面 的 析 取 式 中 的 某 个 子 句 同 | 1D ee 
时 成 立 , 就 存在 一 个 从 s, 到 ss 的 PDG 边 。 因 此 , 我 们 可 能 需 |12: i=l s; 
要 求解 多 达 4 或 4+1 个 整数 线性 规划 问题 来 决定 某 一 条 边 是 “| 2 g 








否 存 在 。 要 求解 的 问题 个 数 依赖 于 请 句 s 是 否 按照 正文 顺序 ”图 11-45 例 11.53 中 的 程序 
出 现在 s 之 前 。 的 执行 顺序 
11.8.4 ”并行 化 算法 

现在 我 们 给 出 一 个 简单 的 并 行 化 算法 。 它 首先 把 计算 任务 分 解 到 尽 可 能 多 的 不 同 循环 中 ， 
然后 独立 地 并 行 化 各 个 循环 。 
在 允许 0(1) 次 同步 的 情况 下 最 大 化 并 行 性 的 度数 。 

输入 : 一 个 带 有 数组 访问 的 程序 。 

输出 : 带 有 固定 多 个 同步 栅 障 的 SPMD 代码 。 

方法 : 

1) 构造 程序 的 程序 依赖 图 , 并 把 语句 分 划 为 强 连 通 分 量 (SCC) 。 回 忆 一 下 10.5.8 节 介 绍 
过 , 一 个 强 连 通 分 量 是 原 图 的 一 个 满足 下 列 条 件 的 最 大 的 分 量 : 其 中 的 每 个 结 点 都 可 以 到 达 所 有 


其 他 结 点 。 

2) 转换 代码 , 使 之 按照 拓扑 顺序 执行 各 个 SCC。 必 要 时 可 以 应 用 裂变 转换 。 

3) 对 每 个 SCC 应 用 算法 11.43, 寻找 出 所 有 的 无 同步 并 行 性 。 在 每 个 被 并 行 化 的 SCC 的 前 
后 都 插入 同步 栅 障 。 口 


虽然 算法 11. 54 能 够 找到 带 有 0(1) 次 同步 的 所 有 并 行 性 度数 , 它 仍 然 存在 一 些 缺点 。 第 一 ， 
它 可 能 引入 不 必要 的 同步 。 作 为 一 个 现实 问题 ,， 如果 我 们 把 这 个 算法 应 用 到 一 个 可 以 被 无 同步 
地 并 行 化 的 程序 上 , 这 个 算法 会 对 每 个 语句 进行 并 行 化 , 并 且 在 执行 各 个 语句 的 并 行 循环 之 间 引 
人 同步 栅 障 。 第 二 , 虽然 只 会 有 固定 多 个 同步 , 但 得 到 的 并 行 化 方案 会 在 每 次 同步 的 时 候 在 不 同 
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的 处 理 器 之 间 传 递 很 多 数据 。 有 些 情况 下 , 通信 开销 会 使 得 并 行 化 的 代价 太 过 昂贵 , 有 时 甚至 不 
如 在 一 个 单 处 再 器 上 顺序 执行 这 个 程序 。 在 后 面 的 各 节 中 , 我 们 将 继续 给 出 提高 数据 局 部 性 的 
手段 , 从 而 降低 通信 量 。 
11.8.5 11.8 节 的 练习 

练习 11.8.1: 把 算法 11. 54 应 用 到 图 11-46 的 代码 上 。 





for (i=0; i<100; i++) 
ATi] = ACi] + X[i]; /* (s1) */ 
for (i=0; i<100; i++) 
for (j=0; j<100; j++) 
B[i,j] = YCi,j] + Ali] + ALj]; /* (s2) */ 








11-46 练习 11.8.1 的 代码 


练习 11. 8.2: 把 算法 11.54 应 用 到 图 11-47 的 代码 上 。 
练习 11. 8.3: 把 算法 11.54 应 用 到 图 11-48 的 代码 上 。 




















for (i=0; i<100; i++) 
Ali] = Ali] + X[i]; /* (st) */ 
for (i=0; i<100; i++) for (i=0; i<100; i++) { 
Ali] = A[i] + X[i];  /* (s1) */ for (j=0; j<100; j++) 
for (i=0; i<100; i++) { B[j] = Ali] + Y[j]; /* (s2) */ 
B[i] = B[i] + ALi]; /* (s2) */ Cli] = B[i] + Z[i]; /* (s3) */ 
for (j=0; j<100; j++) for (j=0; j<100; j++) 
Clj] = Y[j] + BLj]; /* (s3) */ D[i, jj = ALi] + B[j]; /* (s4) */ 
} 
图 11-47 练习 11.8.2 的 代码 图 11-48 练习 11.8.3 的 代码 


11.9 流水 线 化 技术 


在 流水 线 化 技术 中 , 一 个 任务 被 分 成 数 个 阶段 , 各 个 阶段 在 不 同 的 处 理 器 上 进行 。 比 如 ， 一 
个 具有 个 迭代 的 循环 可 以 被 构造 一 个 n 阶段 的 流水 线 。 每 个 阶段 被 分 配给 不 同 的 处 理 器 ,， 当 一 
个 处 理 器 完成 了 它 负 责 的 阶段 后 , 结果 就 作为 输入 传送 到 流水 线 中 的 下 一 个 处 理 器 。 

下 面 我 们 首先 更 加 详细 地 解释 流水 线 化 的 概念 。 然 后 我 们 在 11. 9. 2 节 中 给 出 了 一 个 实际 生 
活 中 的 被 称 为 “连续 过 松弛 方法 ”的 数值 算法 。 我 们 用 这 个 例子 说 明 在 什么 样 的 情况 下 可 以 应 用 
流水 线 化 技术 。 然 后 我 们 在 11. 9. 6 节 中 正式 定义 需要 求解 的 约束 , 并 在 11. 9.7 节 中 描述 一 个 求 
解 这 些 问题 的 算法 。 如 果 一 个 程序 的 时 间 分 划 约 束 具有 多 个 独立 解 , 那么 就 可 以 认为 它 具 有 最 
外 层 的 完全 可 交接 循环 (fully permutable loop) 。 正 如 11.9.8 节 中 将 讨论 的 , 这 样 的 循环 可 以 很 容 
易 地 被 流水 线 化 。 

11.9.1 什么 是 流水 线 化 

前 面 我 们 尝试 对 一 个 循环 组 套 结构 进行 并 行 化 时 , 我 们 对 这 个 循环 藤 套 结构 中 的 迭代 进行 
分 划 , 使 得 任意 两 个 共享 数据 的 迭代 都 被 分 配给 同一 个 处 理 器 上 。 流 水 线 化 技术 人 允许 不 同 处 理 
器 共享 数据 , 但 是 一 般 只 能 以 “局 部 的 ”方式 来 共享 数据 , 数据 只 能 从 一 个 处 理 器 传递 到 所 在 处 






for (i = 1; i <= m; i++) 
for (j = 1; j <= n; j++) 
X[i] = X[i] + Y[i,j]; 
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于 求 和 过 程 。 因 为 数据 依赖 的 原因 ,这 个 循环 必须 顺序 执行 9, 但 是 不 同 的 求 和 过 程 之 间 是 独立 
的 。 我 们 可 以 让 每 个 处 理 器 执行 一 个 独立 的 求 和 过 程 ， 从 而 实现 代码 的 并 行 化 。 处 理 器 i 访问 


的 第 i 行 并 修改 的 第 i 个 元 素 。 


我 们 还 可 以 把 多 个 处 理 器 组 织 成 一 个 流水 线 来 执行 这 个 求 和 过 程 , 并 通过 求 和 过 程 的 重 至 


来 获取 并 行 性 ， 如 图 11- 49 所 示 。 更 明确 地 








讲 ， 内 层 循环 的 每 个 迭代 都 可 以 被 当 作 流水 
线 的 一 个 阶段 : 第 7 个 阶段 获取 在 前 一 阶段 
生成 的 无 的 一 个 元 素 , 将 它 和 了 了 的 一 个 元 素 
相 加 , 并 把 结果 传递 到 下 一 个 阶段 。 请 注意 
在 这 种 情况 下 , 每 个 处 理 器 访问 了 的 一 列 ， 
而 不 是 一 行 。 如 果 了 是 按 列 存放 的 , 那么 通 
过 按 列 分 划 ( 而 不 是 按 行 分 划 ) 就 可 以 提高 局 
部 性 。 


a 
于 间 an = 


1 2 3 











i Txim] 




















x{2]+=Y[21} | X[1]+=Y[1,2] 
3 | xxB+=Y0 | XP]+=¥(2,2) | x0]+=Y{1,3] 
4 | X[4]+=¥[4,1] | X[3]+=Y¥[3,2] | x[2]}+=¥12,3} 
5 X[4]+=¥ [4,2] | X[3]+=Y[3,3] 
6 x [4] +=Y [4,3] 





图 11-49 fi) 11.55 中 的 流水 线 化 的 执行 过 程 ， 
HOA m=4, n=3 


第 一 个 处 理 器 处 理 完 前 一 个 任务 的 第 一 个 阶段 之 后 , 我 们 就 可 以 立刻 启动 一 个 新 的 任务 。 
流水 线 在 开始 时 是 空 的 , 只 有 第 一 个 处 理 器 在 执行 第 一 个 阶段 。 在 它 完成 处 理 之 后 , 结果 被 传送 
到 第 二 个 处 理 器 ,同时 第 一 个 处 理 器 开始 处 理 第 二 个 任务 , 如 此 继续 。 按 照 这 种 方式 , 流水 线 被 
逐渐 填 满 ,直到 所 有 的 处 理 器 都 进入 忙 状态 。 当 第 一 个 处 理 器 完成 了 最 后 一 个 任务 后 , 流水 线 开 
始 排 空 ， 越 来 越 多 的 处 理 器 进入 空闲 状态 , 直到 最 后 一 个 处 理 器 完成 最 后 一 个 任务 。 在 稳定 状态 
F, n 个 任务 在 由 个 处 理 器 组 成 的 流水 线 中 并 行 执行 。 口 
把 流水 线 技术 和 不 同 处 理 器 处 理 不 同 任务 的 简单 并 行 性 进行 比较 是 很 有 意思 的 : 
e 流水 线 化 技术 只 能 应 用 于 深度 至 少 为 2 的 循环 和 伐 套 结构 。 我 们 可 以 把 外 层 循 环 的 每 个 挝 
代 当 作 一 个 任务 ， 而 把 内 层 循 环 的 各 个 迭代 当 作 任务 的 各 个 阶段 。 
。 在 一 个 流水 线 中 运行 的 任务 可 以 具有 数据 依赖 关系 。 属 于 各 个 任务 的 同一 个 阶段 的 信息 
被 存放 在 同一 个 处 理 器 上 。 因 此 , 由 一 个 任务 的 第 i 个 阶段 生成 的 结果 可 以 直接 被 后 继任 
务 的 第 i 个 阶段 使 用 , 不 会 产生 通信 开销 。 类 似 地 ,由 不 同 任务 的 同一 个 阶段 所 使 用 的 每 
个 输入 数据 元 素 必须 存放 在 同一 个 处 理 器 内 ,如 例 11. 55 所 示 。 


如 果 任 务 是 独立 的 , 那么 简单 的 并 行 化 方案 具有 较 好 的 处 理 器 利用 率 , 原因 是 各 个 处 理 


器 可 以 一 起 开始 执行 ,而 不 会 产生 填 满 和 排 空 流水 线 的 开销 。 但 是 , 如 例 11. 55 所 示 , 在 
一 个 流水 线 方案 中 的 数据 访问 模式 和 简单 并 行 化 方案 中 的 模式 不 同 。 如 果 流 水 线 化 技术 
可 以 降低 通信 量 , 那么 就 应 该 选择 这 个 技术 。 


11.9.2 连续 过 松弛 方法 : 一 个 例子 


连续 过 松弛 法 (Successive Over Relaxation ,SOR ) 是 一 个 在 使 用 松弛 方法 求解 联 立 线性 方程 式 
时 加 快 收敛 速度 的 技术 。 图 11-50a 中 显示 的 相对 简单 的 模板 解释 了 这 个 技术 的 数据 访问 模式 。 
在 这 里 ,数组 中 的 一 个 元 素 的 新 值 依 赖 于 它 的 相 邻 元 素 的 值 。 这 个 运算 会 被 重复 执行 , 直到 满足 


某 种 收敛 标准 为 止 。 





图 11-50b 中 显示 的 是 关键 数据 依赖 关系 。 我 们 没有 显示 能 够 从 该 图 中 已 包含 的 依赖 关系 推 
导出 的 依赖 关系 。 比 如 , ER RFRA -1] ,[i,j -2]，, 等 等 。 从 这 个 依赖 关系 可 以 清 





请 记 住 , 我们 没有 利用 加 法 的 交换 率 和 结合 率 。 
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楚 地 看 出 不 存在 无 同步 并 行 性 。 因 为 最 长 的 依赖 关系 链 包 含 了 0(m+n) 个 边 , 通过 引入 同步 ， 
我 们 应 该 可 以 找到 度数 为 1 的 并 行 性 , 并 在 OC +n) 个 时 间 单 位 内 执行 0(mn) 运 算 。 











for (i = 0; i <= m; i++) 
for (j = 0; j <= n; j++) 
X[j+1] = 1/3 * (X[j] + X[j+1] + X[j+2]) 














a) 原来 的 源 代码 b) 代码 中 的 数据 依赖 关系 


图 11-50 连续 过 松弛 法 (SOR) 的 例子 


特别 地 , 我 们 看 到 图 11-50b 中 角度 为 150° 曲 的 斜 线 上 的 各 个 迭代 之 间 没 有 数据 依赖 关系 。 
它们 只 依赖 于 比较 靠近 原点 的 斜 线 上 的 迭代 。 因 此 , 我 们 可 以 从 原点 上 的 斜 线 开始 逐步 向 外 ， 逐 
条 和 斜 线 地 执行 线 上 的 迭代 ,从 而 达到 并 行 化 这 个 代码 的 目的 。 我 们 把 一 个 斜 线 上 的 全 部 迭代 称 
为 波 阵 面 (wave front) ,而 这 样 的 并 行 化 方案 被 称 为 波 阵 面 推进 (wavefronting)。 
11.9.3 完全 可 交换 循环 

我 们 首先 介绍 一 下 完全 可 交换 (full permutability) 的 概念 。 这 个 概念 对 于 流水 线 化 和 其 他 一 
些 优化 技术 都 是 有 用 的 。 多 个 循环 是 完全 可 交换 的 条 件 是 它们 可 以 任意 地 排列 而 不 会 改变 原 程 
序 的 语义 。 一 旦 多 个 循环 具有 完全 可 交换 的 性 质 , 我 们 可 以 很 容易 地 把 相应 的 代码 流水 线 化 ,并 
对 代码 应 用 某 些 转换 ( 比如 分 块 技 术 ) 来 提高 数据 局 部 性 。 

图 11.50a 中 给 出 的 SOR 代码 不 是 完全 可 交换 的 。 如 11.7. 8 节 所 示 , 交换 两 个 循环 的 位 置 意 
昧 着 原来 的 迭代 空间 中 的 迭代 按照 逐 列 (而 不 是 逐 行 ) 的 方式 执行 。 比 如 ,原来 在 近代 [2,3] 中 的 
计算 将 会 在 迭代 [1,4] 的 计算 之 前 执行 , 这 就 违反 了 图 11-50b 中 的 依赖 关系 。 

然而 , 我 们 可 以 通过 代码 转换 使 得 上 面 的 SOR 代码 变 成 完全 可 交换 的 。 对 这 个 代码 应 用 仿 
射 转换 


可 得 到 图 11-51a 中 所 示人 代码。 经 过 转换 得 到 的 代码 是 完全 可 交换 的 , 交换 后 的 版 本 如 图 
11-5le 所 示 。 我 们 在 图 11-51b 和 图 11-51d 中 分 别 显 示 了 这 两 个 程序 的 迭代 空间 和 数据 依赖 
关系 。 从 这 个 图 中 可 以 很 容易 看 出 这 个 重新 排序 保持 了 每 一 对 具有 数据 依赖 关系 的 访问 之 间 
的 相对 顺序 。 

当 我 们 交换 循环 时 , 我 们 极 大 地 改变 了 最 外 层 循 环 的 各 个 迭代 所 执行 的 运算 集合 。 我 们 在 
调度 这 些 运算 时 具有 这 样 的 自由 度 , 说 明 在 对 程序 的 运算 进行 排序 时 有 很 大 的 回旋 余地 。 调 度 
的 余地 意味 着 存在 并 行 化 的 机 会 。 在 本 节 的 稍 后 我 们 将 说 明 如 果 一 个 循环 符 套 结构 具有 大 个 最 
外 层 的 完全 可 交换 循环 , 我 们 仅仅 需要 引入 0(n) 个 同步 运算 , 就 可 以 得 到 OCA -1) 度 的 并 行 性 
(n 是 一 个 循环 中 的 迭代 的 个 数 ) 。 





O 即 不 断 下 移 一 步 再 右 移 两 步 所 得 到 的 点 的 序列 。 
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for (i = 0; i <= m; i++) 
for (j = i; j <= itn; j++) 
X[j-it1] = 1/3 * (X[j-i] + X[j-i+1] + X[j-i+2]) 





SVAVAVAVA 


m p -p 








10 
a) 对 图 11-50 应 用 转换 [| | 后 得 到 的 代码 


` 


b) 图 11-51a 中 的 代码 的 数据 依赖 关系 


J. 











for (j = 0; j <= mtn; j++) 


for (i = max(0,j); i <= min(m,j), i++) 





X[j-i+1] = 1/3 * (X[j-i] + X[j-i+1] + X[j-i+2]) 


c) 图 11-51a 中 的 两 个 循环 的 一 个 重新 排列 


图 11-51 


11. 9. 4 把 完全 可 交换 循环 流水 线 化 











> 


d) 图 1-5lc 中 代码 的 数据 依赖 关系 


图 11-50 中 代码 的 完全 可 交换 版 本 


一 个 具有 个 最 外 层 完 全 可 交换 循环 的 牧 环 铝 套 结构 可 以 被 构造 为 一 个 0(k -1) 维 的 流水 
线 。 在 SOR 的 例子 中 ,上 =2, 因此 我 们 可 以 把 处 理 器 构造 成 一 个 线性 流水 线 。 


我 们 可 以 用 两 种 不 同 的 方法 对 上 
面 的 SOR 代码 进行 流水 线 化 ， 如 图 
11-52a 和 图 11-52b 所 示 。 这 两 种 流水 
线 化 方案 分 别 对 应 于 图 11-51a 和 图 
11-51c 所 示 的 两 种 可 能 的 排列 。 在 每 





/* 0 <= p <= m */ 

for (j = p; j <= ptn; j++) { 
if (p > 0) wait (p-1); 
X[j-pti] = 1/3 * (X[j-p] + X[j-p+1] + X[j-p+2]); 
if (p < min (m,j)) signal (p+1); 

} 





一 种 情况 下 ， 相 应 迭代 空间 的 每 一 列 
组 成 一 个 任务 , 而 每 一 行 组 成 一 个 流 
水 线 阶段 。 我 们 把 第 i 个 阶段 分 配给 处 
FESS i, 因此 每 个 处 理 器 执行 内 层 循环 
的 代码 。 不 考虑 边界 条 件 ， 只 有 在 处 
理 器 p -1 执行 了 迭代 i -1 之后, 处 理 
器 p 才 可 以 执行 迭代 i。 

假设 每 个 处 理 器 用 同样 的 时 间 来 
执行 一 个 和 迭代, 并 且 同 步 运 算 在 瞬时 





a) 把 处 理 器 分 配给 各行 








/* 0 <= p <= mtn */ 

for (i = max(0,p); i <= min(m,p); i++) { 
if (p > max(0,i)) wait (p-1); 
X[p-it1] = 1/3 * (X[p-i] + X[p-i+1] + X[p-i+2]); 
if (p < mtn) & (p > i) signal (p+1); 





b) 把 处 理 器 分 配给 各 列 


图 11-52 图 11-51 中 的 代码 的 两 个 流水 线 化 实现 
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发 生 。 这 两 个 流水 线 化 方案 将 并 行 执行 同样 的 迁 代 , 唯一 的 区 别 是 它们 的 处 理 嚣 分 配方 法 不 同 。 
在 图 11-51b 中 的 迭代 空间 中 ,所 有 并 行 执行 的 迭代 处 于 135* 的 斜 线 上 ， 这些 斜 线 对 应 于 原 迭 代 
空间 中 的 150* 斜 线 ， 见 图 11-50b。 

但 是 在 实践 中 , 带 有 高 速 缓存 的 处 理 器 执行 同一 代码 所 花 的 时 间 并 不 总 是 相同 的 , 用 于 同步 
运算 的 时 间 也 会 有 所 变化 。 使 用 同步 栅 辜 将 使 所 有 的 处 理 器 按照 -- 致 的 步调 进行 运算 。 和 同步 
柚 障 方法 不 同 ,流水 线 化 技术 最 多 要 求 处 理 器 和 另外 两 个 处 理 器 进行 同步 和 通信 。 因 此 , 流水 线 
化 的 波 阵 面 更 加 松弛 ， 人 允许 有 些 处 理 器 领先 而 其 他 处 理 器 暂时 落后 。 这 个 灵活 性 降低 了 处 理 器 
在 等 待 其 他 处 理 器 时 所 花 的 时 间 , 提高 了 并 行 性 能 。 

可 以 把 这 个 计算 任务 流水 线 化 的 方法 有 很 多 ， 上 面 显示 的 流水 线 化 方案 只 是 其 中 的 两 个 。 
我 们 说 过 ,只 要 一 个 循环 岩 套 结构 是 完全 可 交换 的 , 我 们 在 选择 代码 并 行 化 方案 方面 就 有 很 大 的 
自由 度 。 第 一 个 流水 线 方案 把 迄 代 [i, 站 映射 到 处 理 器 i 第 二 个 方案 把 迭代 [i 门 映射 到 处 理 器 产 
只 要 co 和 cy 是 正常 数 ,我 们 就 可 以 把 迭代 [i, 门 映射 到 处 理 器 coi +c, 从 而 得 到 其 他 的 流水 线 
化 方案 。 这 样 的 方案 将 创建 出 不 同 的 流水 线 ,它们 的 松弛 波 阵 面 位 于 90°( 不 含 ) 到 180° RG) 
之 间 。 

11.9.5 一 般 性 的 理论 

刚刚 讨论 的 例子 解释 了 关于 流水 线 化 的 一 般 性 理论 : 如 果 我 们 能 够 在 一 个 循环 谋 套 结构 中 
找到 至 少 两 个 不 同 的 最 外 层 循环 ， 并 满足 所 有 的 依赖 关系 ,那么 就 可 以 把 这 个 计算 过 程 流水 线 
化 。 一 个 具有 上 个 最 外 层 完全 可 交换 循环 的 循环 戏 套 结构 具有 上 - 1 度 的 流水 线 化 并 行 度 。 

不 能 被 流水 线 化 的 循环 符 套 结构 没有 可 交换 的 外 层 循环 。 例 11. 56 给 出 了 这 样 的 例子 。 为 
了 遵循 所 有 的 依赖 关系 ,在 最 外 层 循环 中 的 每 个 迄 代 必须 精确 执行 原来 代码 中 的 计算 任务 。 但 
E, 这 样 的 代码 仍然 可 能 在 内 层 循环 中 包含 并 行 性 。 要 利用 这 种 并 行 性 , 我 们 必须 引入 至 少 n 个 
同步 运算 ,其 中 n 是 最 外 层 循环 中 的 选 代 个 数 。 

GEI 图 11-53 是 我 们 在 例 11.50 中 所 见 程序 的 一 个 更 复杂 的 版 本 。 如 图 11-53b 的 程序 依 
MEIR, WA s, 和 ss 属于 同一 个 强 连通 分 量 。 因 为 我 们 不 知道 矩阵 4 中 的 内 容 , 所 以 必须 假 
设 语句 sz 中 的 访问 可 以 读 取 了 的 任何 元 素 。 从 语句 si 到 语句 s, 之 间 有 一 个 真 依赖 关系 ,并 且 从 
语句 ss 到 语句 si 存在 一 个 反 依赖 关系 。 这 两 个 语句 都 没有 进行 流水 线 化 的 机 会 ,因为 属于 外 层 
循环 的 迭代 i 的 所 有 运算 必须 在 属于 和 迭代 i + 1 的 所 有 运算 之 前 进行 。 为 了 找到 更 多 的 并 行 性 ， 
我 们 对 内 层 循环 重复 并 行 化 过 程 。 第 二 个 循环 中 的 和 迭代 可 以 被 无 同步 地 并 行 化 。 因 此 , 我 们 需 
要 200 个 同步 栅 障 , 在 内 层 循环 的 每 次 执行 之 前 和 之 后 各 需要 一 个 。 





























for (i = 0; i < 100; i++) { 
for (j = 0; j < 100; j++) 

X[j] = X[j] + Y[i,j]; /* (st) */ 

Z[i] = XC[A[i]]; /* (32) */ 

} 





a) b) 





图 11-53 ”一 个 顺序 化 的 外 层 循环 (参见 图 a) 以 及 它 的 PDG 图 (参见 图 p) 


11.9.6 时 间 分 划 约 束 
现在 我 们 关注 寻找 流水 线 化 并 行 性 的 问题 。 我 们 的 且 标 是 把 一 个 计算 任务 转变 成 为 一 组 可 
流水 线 化 的 任务 。 为 了 找到 流水 线 化 的 并 行 性 , 我 们 没有 像 处理 循 环 并 行 性 时 那样 直接 求 出 各 


550 第 11 章 





个 处 理 器 上 将 执行 哪些 计算 , 而 是 提出 了 下 面 的 根本 性 问题 ; 所 有 可 能 的 遵循 循环 中 原 有 数据 依 
丙 关 系 的 执行 序列 有 哪些 ?显然 , 原来 的 执行 序列 满足 所 有 的 数据 依赖 关系 。 问 题 是 是 否 存 在 
这 样 的 仿 射 转换 ,由 它 可 以 创建 另 一 种 调度 , 使 得 最 外 层 循环 的 各 个 迭代 执行 的 运算 集合 和 原来 
不 同 , 但 是 依然 满足 所 有 的 依赖 关系 。 如 果 我 们 能 够 找到 这 样 的 转换 ， 就 能 够 把 这 个 循环 结构 流 
水 线 化 。 要 点 在 于 如 果 在 调度 运算 时 存在 自由 度 , 那么 就 存在 并 行 性 。 后 面 将 会 解释 如 何 从 这 
样 的 转换 中 获取 流水 线 化 并 行 性 的 细节 问题 。 
为 了 找 出 可 接受 的 外 层 循环 的 重新 排序 , 我 们 希望 为 每 个 语句 找到 一 个 一 维 仿 射 变换 ,这 个 
变换 把 原来 的 循环 下 标 值 映射 到 最 外 层 牧 环 的 迭代 编号 上 。 如 果 这 样 的 分 配 能 够 满足 程序 中 的 
所 有 数据 依赖 关系 ,那么 变换 就 是 合法 的 。 下 面 显示 的 “时 间 分 划 约 束 ” 就 是 说 如 果 一 个 运算 依 
束 于 另 一 个 运算 , 那么 分 配给 前 一 个 运算 的 最 外 层 循 环 的 迭代 必须 不 早 于 分 配给 第 二 个 运算 的 
和 迭代。 如 果 它 们 被 分 配 到 同一 个 迭代 , 我 们 都 知道 在 此 迭代 中 第 一 个 运算 必须 在 第 二 个 之 后 
执行 。 
程序 的 一 个 仿 射 分 划 映 射 是 一 个 合法 的 时 间 分 划 (legal-time partition) 当 且 仅 当 对 于 任意 两 个 
具有 依赖 关系 的 (可 能 相同 的 ) 访 问 ， 比 如 峙 套 在 循环 结构 di 中 的 语句 s 中 的 访问 
A= <P, BIDI> 
MRE EE BH ds 中 的 语句 ss 的 访问 
Fy = < Ffa, By, by > 
Sy WT DL FIR si M sy 的 一 维 分 划 了 映射 < Ci,c1 > F <C, e > 满足 下 面 的 时 间 分 划 约 束 (time- 
partition constraint) : 
。 对 于 满足 下 列 条 件 的 24 PR TAT AY i) 和 Z° PROTA i, 
1) i <s,s,i2 
2) Bi +b, 20 
3) Boi, +b, 20 
4) Fii +f, = Fob th 
必然 有 CIP +e SCi +cao 
图 11-54 中 显示 的 这 个 约束 和 空间 分 划 约 束 看 起 来 非常 相似 。 它 是 空间 分 划 约 东 的 一 个 放松 
版 本 。 如 果 两 个 迭代 指向 同一 个 位 二 | 
B, 这 个 约束 不 要 求 它们 被 映射 到 O A.B. PUTER ea rece 
同一 个 分 划 单元 。 我 们 只 要 求 这 两 < 
个 迁 代 之 间 的 相对 执行 顺序 保持 不 
变 。 也 就 是 说 , 在 空间 分 划 约 束 中 
使 用 = 的 地 方 ， 这 个 约束 使 用 志 。 
我 们 知道 ,这 个 时 间 分 划 约 束 
至 少 存在 一 个 解 。 我 们 可 以 把 最 外 
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层 循环 的 每 个 迭代 中 的 运算 映射 到 he 
同一 个 迭代 中 去 , 此 时 所 有 的 数据 j 
依赖 关系 都 得 到 满足 。 对 于 那些 不 时 间 步 
能 被 流水 线 化 的 程序 ,这 个 解 是 它 图 11-54 ”时 间 分 划 约 束 


们 的 时 间 分 划 约 束 的 唯一 解 。 男 一 
方面 ,如 果 我 们 能 够 找到 时 间 分 划 约 束 的 多 个 独立 解 ， 这 个 程序 就 能 够 被 流水 线 化 。 每 个 独立 解 
对 应 于 最 外 层 完 全 可 交换 循环 该 套 结构 中 的 一 个 循环 。 如 你 所 期 望 的 , 因为 例 11. 56 中 的 程序 没 
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有 可 流水 线 化 的 并 行 性 , 因此 从 中 抽取 得 到 的 时 间 分 划 约 束 只 有 一 个 独立 解 。 而 上 面 的 SOR 代 
码 的 例子 则 存在 两 个 独立 解 。 

AT 我 们 考虑 一 下 例 11. 56, 特别 是 考虑 语句 s 和 ss 中 对 数组 X 的 引用 之 间 的 依赖 关 
系 。 因 为 语句 s 中 的 访问 不 是 仿 射 的 , 所 以 在 涉及 语句 ss 的 依赖 分 析 中 , 我 们 把 和 矩阵 了 了 建 模 为 
一 个 标量 变量 ， 从 而 近似 地 处 理 这 个 访问 。 令 对 旋 为 s 的 一 个 动态 实例 的 下 标 值 , © 站 为 s, 的 
一 个 动态 实例 的 下 标 值 。 令 语句 s 和 ss 的 计算 任务 的 上 映射 分 别 为 < [Ci, Cal, o > 
AN < [Ca], > 





之 后 的 s; 的 第 全力 个 迭代 不 得 晚 于 转换 之 后 的 的 第 站 个 迭代 。 也 就 是 说 
[Ci Call] +o Ct te 
展开 后 得 到 
Cyt tC teo SCi +04 
因为 i 和 i 及 i 无 关 , 所 以 可 以 取 任 意 大 的 值 , 因此 Ci =0 必须 成 立 。 可 知 , 这 个 约束 的 一 个 可 
能 的 解 是 - 
Cu = Cy =1 H C =e, =e, =0 

对 于 从 sz 到 si 以 及 从 ss PE A URS AE AS SSS LR, SUED NE i 
EAH ss 的 第 i 个 实例 和 si 的 所 有 实例 (i,j) 组 成 。 在 这 个 特定 的 解 中 , 这 个 迭代 将 被 分 配给 第 i 
个 时 间 步 又 。 选 择 其 他 的 Cy .Ciz Cor vc, cp 的 值 会 得 到 类 似 的 分 配方 法 , 但 是 会 存在 一 些 不 进 
行 任何 运算 的 时 间 步 又。 也 就 是 说 ,调度 这 个 外 层 循环 的 所 有 方法 都 要 求 其 中 的 和 迭代 按照 与 原 
代码 同样 的 顺序 进行 。 不 管 全 部 的 100 个 迭代 是 在 同一 个 处 理 器 上 执行 , 还 是 在 100 个 不 同 的 处 
理 器 上 执行 ,又 或 在 1 ~ 100 之 间 的 任意 多 个 处 理 器 上 运行 ， 上面 的 论断 都 成 立 。 口 
在 图 11-50a 中 显示 的 SOR 代码 中 , 写 引用 X[j+1] 和 它 本 身 ， 以 及 代码 中 的 三 个 读 
引用 之 间 具 有 依赖 关系 。 我 们 要 为 该 赋值 语句 寻找 计算 任务 的 映射 < [Ci ,Cs],c >，, 使 得 如 果 存 
FEC) BIC) 的 依赖 关系 ,那么 

[4 Gi[|+lei<ta ef] te 

RRE, GDL J), ee, BAi<i', BACi=i' Aj<j'). 

让 我 们 考虑 三 对 数据 依赖 关系 : 

1) 从 写 访问 X[j+1] 到 读 访 问 X[j+2] 之 间 的 真 依 赖 关 系 。 因 为 它们 的 实例 必须 访问 同一 
个 位 置 , 因此 j+1= 放 +2, 或 者 说 j= 六 +1。 把 j=j"+1 替换 到 时 间 约 束 中 , 我 们 得 到 

C1(i’ -i) = 6,20 
由 j= 六 +1 可知 j>j ,上面 的 先后 关系 约束 归 约 为 i<i。 因 此 
C, - C,20 

2) 从 读 访问 XL +2] SIS AL +1] 的 反 依 赖 关 系 。 这 里 ]+2 =j +1, Byasy'-1. 把 j= 

7-1 RABAT 








C -i) +C,>0 
当 = 时 得 

C, 20 
Mic, ANC, 20, 我 们 得 到 





C 20 
3) 从 写 访问 X[j+1] 到 自身 的 输出 依赖 。 这 里 j= 产 。 时 间 约 束 被 归 约 为 
C,(i' ~i) 20 
ALARA i <i 是 相关 的 , 我们 还 是 得 到 
C, 20 
其 余 的 依赖 关系 没有 产生 任何 新 的 约束 。 总 共有 三 个 约束 : 
C, 20 
C,20 
C ~C,20 


i| 1 
loll] 
第 一 个 解 保持 了 最 外 层 循 环 的 迭代 执行 顺序 。 图 11-50a 中 原来 的 SOR 代码 和 图 11-51a 中 转 
换 得 到 的 代码 都 是 这 种 安排 的 例子 。 第 二 个 解 把 没 着 135° 斜 线 上 的 迭代 放置 在 外 层 循环 的 同一 
个 迭代 中 。 图 11-51b 中 显示 的 是 具有 这 种 最 外 层 循 环 组 成 方式 的 代码 的 一 个 例子 。 
请 注意 , 存在 多 个 其 他 可 能 的 独立 解 对 ， 比 如 
1 2 
LEEI 
也 是 具有 同样 约束 的 独立 解 。 我 们 选择 最 简单 的 向 量 来 简化 代码 转换 。 o 
11.9.7 用 Farkas 引 理 求解 时 间 分 划 约 束 
因为 时 间 分 划 约 束 和 空间 分 划 约 束 类 似 , 那么 是 否 可 以 用 一 个 类 似 的 算法 来 求解 这 些 约 束 
E? BRKE, 两 类 问题 之 间 的 少许 不 同 使 得 两 个 解决 方法 在 技术 上 存在 很 大 不 同 。 算 法 11. 43 
直接 求解 Ci .cl C 和 cs 的 满足 下 面条 件 的 值 , 使 得 对 于 所 有 ZA p i, A epi, 如 果 
Fii +f, =Fis +h, 


下 面 是 这 些 约束 的 两 个 独立 解 : 


成 立 , 那么 
Cii, +e, =i, +e 

根据 循环 界限 而 得 到 的 线性 不 等 式 只 用 于 确定 两 个 引用 是 否 具 有 数据 依赖 关系 , 没有 其 他 
用 途 。 

为 了 找 出 时 间 分 划 约 束 的 解 , 我 们 不 能 忽略 线性 不 等 式 i <i’, 忽略 它们 经 常会 使 得 只 存在 平 
凡 解 ,而 平凡 解 会 把 所 有 的 迭代 都 放 到 同一 个 分 划 单 元 中 。 因 此 , 寻找 时 间 分 划 约 束 解 的 算法 必 
须 同时 处 理 等 式 和 不 等 式 。 

我 们 希望 解决 的 一 般 性 问题 是 : 给 定 一 个 矩阵 4, 找 出 一 个 向 量 c 使 得 对 于 所 有 满足 Ax 20 
的 向 量 x, 都 有 cix 宇 0。 换 旬 话说 , 我 们 在 寻找 向 量 c, 使 得 c 和 hx 宇 0 所 定义 的 多 面体 之 内 任 
何 向 量 的 内 积 总 是 大 于 0。 

这 个 问题 可 以 用 Farkas 引 理 解决 。 令 4 为 一 个 mxn 的 实数 矩阵, He 为 一 个 实数 、 非 零 的 n 
维 向 量 。Farkas 引 理 说 要 么 原 不 等 式 系统 

Ax 20 cx <0 
具有 一 个 实数 解 x, 要 么 相应 的 对 偶 系 统 
Aly =c, y20 
具有 一 个 实数 解 y, 但 是 两 者 不 会 同时 成 立 。 
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这 个 对 偶 系 统 可 以 用 Fourier-Motzkin 消除 法 进行 处 理 , 通过 投影 消除 变量 y。 这 个 引 理 保证 
对 于 每 个 对 偶 系 统 中 有 解 的 向 量 c， 原 系统 不 存在 解 。 换 句 话说 , 我 们 可 以 找到 对 个 系统 4 Py = 
c, y>0 的 解 ,从 而 证 明 系 统 的 否 命题 , 即 对 于 所 有 满足 hr>0 H x, 都 有 ex 30, 





关于 Farkas 引 理 

关于 这 个 引 理 的 证 明 可 以 在 很 多 关于 线性 规划 的 标准 课本 中 找到 。 最 早 在 1901 年 被 证 
明 的 Farkas 引 理 是 择 一 性 定理 之 一 。 这 些 定理 相互 等 价 , 但 是 尽管 经 过 了 多 年 的 尝试 ， 人 们 
仍然 没有 找到 有 关 这 个 引 理 或 者 它 的 某 个 等 价 定理 的 简单 、 直 观 的 证 明 。 





: 为 一 个 外 层 的 顺序 循环 找到 一 个 合法 的 最 大 线性 独立 的 仿 射 时 间 分 划 上 映射 。 
输入 : 一 个 带 有 数组 访问 的 循环 恢 套 结构 。 

输出 : 线性 独立 时 间 分 划 上 映射 的 最 大 集 。 

方法 : 算法 包括 以 下 步骤 : 

1) 找 出 程序 中 所 有 具有 数据 依赖 关系 的 访问 对 。 

2) 对 于 每 一 对 具有 数据 依赖 的 访问 , 在 循环 结构 di 中 的 语句 s| 中 的 访问 而 = <P, of, By, 
bi > RRETARA d 中 的 语句 的 访问 A = < 忆 , 户 ,B ,8 >， 令 <Clcl> 和 <Ca,ca > 
分 别 为 语句 si Als. 的 (未 知 的 ) 时 间 分 划 上 映射。 回顾 一 下 ,时 间 分 划 约 束 是 说 : 

o 如 果 Z4 中 所 有 的 站 和 Zo PY i, 满足 下 列 条 件 ， 

1) i <ss,i2 

2) Bii +b, 20 

3) Bai, +b, 20 

4) Fii +f, = Poin th 

那么 必然 有 CD +e) sOi +e, 

ALA i xi 是 多 个 子 句 的 析 取 式 ， 因 此 我 们 可 以 为 每 个 子 句 创立 一 个 约束 系统 , 并 单独 对 它们 
求解 。 方法 如 下 : 

© 和 算法 11.43 的 步骤 2@ 类 似 , 对 方程 
Fii tfi = Fain +f 





应 用 高 斯 消除 法 把 向 量 


归 约 为 某 个 未 知 量 的 向 量 x。 
O 令 c 为 这 个 分 划 映 射 中 的 所 有 未 知 量 。 把 因为 分 划 有 映射 而 产生 的 线性 不 等 式 约束 可 写成 
ciDx>0 
Hh D 为 一 个 和 矩阵。 
© 把 循环 下 标 变 量 的 先后 关系 约束 和 循环 边界 表示 为 
Ax 20 
其 中 4 为 一 个 矩阵 。 
@ 应 用 Farkas 引 理 。 找 到 满足 上 面 两 个 约束 的 x 的 任务 等 价 于 寻找 满足 下 列 条 件 的 y: 
ATy=D'c Hy >0 
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请 注意 , 这 里 的 cD 就 是 Farkas 引 理 中 的 cr， 而 且 我 们 使 用 的 是 这 个 引 理 的 否定 形式 。 

© 在 这 个 形式 中 , 应 用 Pourier-Moizkin 消除 法 把 y 的 变量 通过 投影 消除 ,并 把 关于 系数 < 的 
约束 表示 为 Ec 宇 0。 

@ 令 E'c' >0 为 不 包含 常量 项 的 约束 。 

3) 使 用 附录 B 中 的 算法 B. 1, 找 出 E'e' >0 的 线性 独立 解 的 最 大 集合 。 这 一 复杂 的 算法 的 基 
本 思路 是 眼 踪 每 个 语句 的 当前 解 集 , 并 通过 插入 一 些 约束 不 断 寻 找 更 多 的 独立 解 。 这 些 被 插入 
的 约束 会 保证 相应 的 解 至 少 对 于 一 个 语句 来 说 是 线性 独立 的 。 

4) 根据 找到 的 每 个 解 c' 得 到 一 个 仿 射 时 间 分 划 映 射 。 喘 射 的 常量 项 遂 过 不 等 式 Ec >0 得 
到 。 L 
fm 11.57 的 约束 可 以 写作 








J 
[-C -Cp Cy (es -cl)] zi 20 
1 
t 
[-1 0 1 03% |>o 
L 
1 
Farkas 引 理 说 这 些 约束 和 
a -Cii 
0 -C 
vis 2? H 250 
Ca 
0 C2 ~ cy 


等 价 。 解 这 个 不 等 式 系统 , 我 们 得 到 
Cy, = Cy, 20 H Cy, =e) -c=0 

请 注意 , 我 们 在 例 11.57 中 得 到 的 特定 解 满足 这 些 约束 。 E 
11.9.8 ”代码 转换 

如 果 一 个 循环 颈 套 结构 的 时 间 分 划 约 束 存 在 大 个 独立 解 ， 那么 就 可 能 把 这 个 循环 城 套 结构 转 
换 成 为 具有 上 个 最 外 层 完 全 可 交换 循环 的 结构 。 可 以 对 这 个 结构 进行 转换 得 到 上 -1 度 的 流水 
R, 或 得 到 大 -1 个 可 并 行 化 的 内 层 循环 。 而 且 , 我 们 还 可 以 对 完全 可 交换 循环 应 用 分 块 技术 , 以 
提高 单 处 理 器 系统 的 数据 局 部 性 或 降低 并 行 执行 中 的 处 理 融 之 间 的 同步 开销 。 

利用 完全 可 交换 循环 

如 果 一 个 循环 霸 套 结构 的 时 间 分 划 约 束 具 有 上 个 独立 解 , 我 们 就 可 以 容易 地 根据 这 些 解 生成 
一 个 循环 嵌 套 结构 ,其 最 外 层 的 上 个 循环 是 完全 可 交换 的 循环 。 通 过 直接 把 第 个 解 变 成 新 转换 
AR AT, 我 们 就 可 以 得 到 这 样 的 转换 。 一 旦 构造 出 这 个 仿 射 变换 , 我 们 就 可 以 使 用 算法 11. 45 
来 生成 代码 。 
在 例 11. 58 中 为 我 们 的 SOR 例子 找到 的 解 是 


PEN 
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这 个 转换 生成 图 11-51a 中 的 代码 。 
如 果 我 们 把 第 二 个 解 作为 第 一 行 , 我 们 可 以 得 到 转换 
1 1 
E 
它 生 成 图 11-51. 中 的 代码 。 口 

显然 , 这 样 的 转换 产生 了 一 个 合法 的 顺序 程序 。 第 一 行 按照 第 -个 解 来 分 划 整 个 迭代 空间 。 时 间 
约束 保证 这 样 的 分 解 不 会 违反 任何 数据 依赖 关系 。 然 后 , 我 们 根据 第 二 个 解 对 各 个 最 外 层 循 环 中 的 选 
代 进 行 分 划 。 这 个 分 划 必 然 是 合法 的 , 原因 是 我 们 处 理 的 是 原来 的 迭代 空间 的 子 集 。 对 于 和 矩阵 中 的 其 
RET, 以 上 讨论 仍然 成 立 。 因 为 我 们 可 以 任意 排列 这 些 解 , 所 以 这 些 循环 是 完全 可 交换 的 。 

利用 流水 线 化 技术 

我 们 可 以 轻易 地 把 一 个 具有 天 个 最 外 层 完全 可 交换 循环 的 循环 藤 套 结构 转换 成 为 一 个 具有 
F-1 度 流水 线 并 行 性 的 代码 。 

让 我 们 回 到 SOR 的 例子 。 在 例子 中 的 循环 都 被 转换 为 完全 可 交换 的 循环 之 后 , 我 们 
知道 只 要 在 迭代 [ 纪 ,iz -1 和 [i - 1,6 JT ZUR, 迭代 [5 ,is] 就 可 以 被 执行 。 我 们 可 以 用 如 下 
方法 在 一 个 流水 线 中 保证 这 个 顺序 。 我 们 把 迭代 i 分 配给 处 理 器 p, 。 每 个 处 理 器 按照 原来 的 顺 
序 执行 内 层 循环 中 的 选 代 , 因此 保证 了 和 迭代 [5 h EERI ,PP -1] 之 后 执行 。 另 外, 我们 要 求 
处 理 器 p 在 执行 迁 代 [p,z] 之 前 必须 等 待 处 理 器 P -1 的 信号 , 这 个 信和 号 表明 处 理 器 p -1 已 经 执 
43 THER p -1,i, ]。 这 个 技术 可 以 根据 图 11-51a 和 图 11-51b 中 的 完全 可 交换 循环 分 别 生成 图 
11-52a 和 图 11-52b 中 的 代码 。 

一 般 来 说 , 给 定 个 最 外 层 的 完全 可 交换 循环 , 具有 下 标 值 (i ，… ,i ) 的 迭代 可 以 执行 且 不 

违反 数据 依赖 约束 的 前 提 是 下 列 迭 代 
[iy -1 iz, th] ; [i ,i —1,i3,."" ,i ] ots [i RE ikea] 

已 经 执行 完毕 。 因 此 , 我 们 可 以 按照 如 下 方法 把 这 个 迭代 空间 的 前 上 -1 个 维度 的 分 划分 配 到 
Oln!) 个 处 理 器 上 。 每 个 处 理 器 负责 一 个 迭代 的 集合 , 该 集合 中 迭代 的 下 标 值 在 前 上 -1 个 维 
度 上 相同 ,而 第 大 个 下 标 值 则 包括 了 该 下 标的 全 部 可 能 值 。 每 个 处 理 器 顺序 地 执行 第 有 个 循环 中 
的 迭代 。 前 有 -1 个 循环 下 标 值 [pi ,ps ,… ,pi -1 jj 所 对 应 的 处 理 器 可 以 执行 第 个 循环 的 第 i 个 迭 
代 的 前 提 是 它 收 到 了 处 理 器 

[Pi —1,p2,°° pr-1), ts [Prst Pk-2Pk-1 71] 
发 出 的 信和 号, RAENEARITE TE AE k MEA PIA i MER 

波 阵 面 化 

根据 一 个 具有 上 个 最 外 层 完全 可 交换 循环 的 循环 结构 生成 -1 个 可 并 行 化 内 层 循环 是 比较 
容易 的 。 虽 然 我 们 更 倾向 于 使 用 流水 线 化 , 但 为 完整 起 见 , 我 们 仍 在 这 里 给 出 这 个 方法 。 

我 们 使 用 一 个 新 的 下 标 变量 来 分 划一 个 具有 个 最 外 层 完全 可 交换 循环 的 循环 结构 的 计 
算 任务 , 其 中 局 被 定义 为 这 % 个 可 交换 循环 中 所 有 下 标的 某 种 组 合 。 上 比如, i =i +… ti 就 是 这 
样 的 一 个 组 合 。 

我 们 创建 一 个 最 外 层 的 顺序 循环 , 该 循环 以 升序 遍历 这 个 i 分 划 , 在 各 个 分 划 单 元 中 的 计算 
任务 依然 按 以 前 的 顺序 执行 。 每 个 分 划 单 元 中 的 前 -1 个 循环 一 定 是 可 并 行 化 的 。 直 观 地 讲 ， 
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如 果 给 定 一 个 二 维 的 迭代 空间 , 这 个 转换 沿 着 135° 的 斜 线 把 迭代 组 合 直 来 , 作为 外 层 循环 的 一 次 
执行 。 这 个 策略 保证 了 在 最 外 层 循环 中 的 各 个 选 代 之 间 没 有 数据 依赖 。 


分 块 


一 个 深度 为 大 的 完全 可 交换 的 循环 伐 套 结构 可 以 在 大 个 维度 上 进行 分 块 。 我 们 可 以 把 多 个 
迭代 的 块 组 合成 为 一 个 单元 , 而 不 是 根据 最 外 层 或 者 最 内 层 的 循环 下 标 值 把 迭代 分 配给 处 理 器 。 
分 块 技术 可 以 用 于 增强 数据 局 部 性 并 最 小 化 流水 线 的 开销 。 

假设 我 们 有 一 个 二 维 完全 可 交换 的 循环 柑 套 结构 , 如 图 11-55a 所 示 ， 且 我 们 希望 把 这 个 结构 的 计 
算 任务 分 成 b xb 块 。 分 块 后 的 代码 的 执行 顺序 如 图 11-56 所 示 , 等 价 的 代码 显示 在 图 11-55b 中 。 





for (ii = 0; ii<n; i+=b) 





for (i=0; i<n; i++) 
for (j=1; j<n; j++) { 
<S> 


} 


for (jj = 0; jj<m; jj+=b) 
for (i = ii*b; i <= min(ii*b-1, n); i++) 


for (j = ii*b; j <= min(jj*b-1, n); j++) { 
<S> 
} 








a) 一 个 简单 的 循环 嵌 亦 结构 


b) 这 个 循环 伐 讲 结构 的 分 块 版 本 


图 11-55 ”一 个 二 维 循环 嵌 套 结构 和 它 的 分 块 版 本 





SR 


| Panse a 
Qa OD 一 0 一 9 SO 
SS 








a) 之 前 








b) 之 后 


图 11-56 在 对 一 个 深度 为 2 的 循环 嵌 套 结构 分 块 之 前 和 分 块 之 后 的 执行 顺序 


如 果 我 们 把 每 个 块 分 配给 一 个 处 理 器 , 那么 在 同一 个 块 中 从 一 个 迭代 到 另 一 个 迭代 的 数据 
传递 不 需要 处 理 器 之 间 的 通信 。 我 们 还 可 以 把 块 的 一 列 分 配给 一 个 处 理 器 , 以 便 加 粗 流 水 线 的 
粒度 。 请 注意 , 每 个 处 理 器 只 在 块 的 边界 上 和 它 的 前 驱 及 后 继 进行 通信 。 因 此 , 分 块 的 另 一 个 优 


点 是 程序 只 需要 在 块 和 它 的 邻居 块 的 边界 上 
交换 被 访问 的 数据 。 处 于 块 内 部 的 数据 仅 由 
一 个 处 理 器 处 理 。 

ER ERNEA AK hg 
算 法 一 一 Cholesky 4} 解 一 一 来 说 明 算 法 
11. 59 是 如 何在 只 有 流水 线 化 并 行 性 的 情况 
下 处 理 单 循环 坐 套 结 构 的 。 岁 11-57 中 显示 
的 代码 实现 了 一 个 0(m ) 的 算法 , 该 算法 对 
一 个 二 维 数据 数组 进行 运算 。 被 执行 的 迭代 












for (i = 1; i <= N; i++) { 
for (j = 1; j <= i-1; j++) { 
for (k = 1; k <= j-4; k++) 
Xfi, j] = X0i,j] - X[i,k] * X[j,k]; 
Xfi,j] = X0i,j] / X[j,j]; 
} 
for (m = 4; m <= i-1; m++) 
x[i, i] = X[i,i] - X[i,m] * X[i,m]; 
Xfi,il = sqrt(X[i,i]); 
} 








图 11-57 Cholesky 分 解 





A AE—P HAVE ERB, A | ASHI USAGE TY be i AOI, TE RANE | 的 
值 。 这 个 循环 结构 有 四 个 语句 , BMA DAB RE TE ER 

对 这 个 程序 应 用 算法 11. 59 可 以 找到 三 个 合法 的 时 间 维 度 。 它 把 所 有 的 运算 都 宜人 到 一 个 
三 维 的 完全 可 交换 的 循环 做 套 结构 中 去 。 其 中 的 某 些 运算 在 原 程序 中 是 典 套 在 深度 为 1 或 2 的 
循环 结构 中 的 。 图 11-58 中 显示 了 得 到 的 代码 和 相应 的 映射 。 





for (i2 = i; i2 <= N; i2++) 
for (j2 = 1; j2 <= i2; j2++) { 
/* 处 理 器 (i2,j2) 的 代码 的 开始 */ 
for (k2 = 1; k2 <= i2; k2++) { 


// 映射 : i2 = i, j2 = j，k2 = k 
if (j2<i2 && k2<j2) 
X[i2,j2] = X[i2,j2] - X(i2,k2] * X(j2,k2]; 


// 映射 : i2 = i, j2= j, k2= 3 
if (j2==k2 && j2<i2) 
X[i2,j2] = X[i2,j2] / X[j2,j2]; 


// 映射 : i2 = i, j2= i, k2 =m 
if (i2==j2 && k2<i2) : 
X[i2,i2] = X[i2,i2] - x(i2,k2] * X[i2,k2]; 


// 映射 : i2 = i, j2 = i, k2=i 
if (i2==j2 && j2==k2) 
X[k2,k2] = sqrt (X(k2,k2]); 


} 
/* 处 理 器 (i2,j2) 的 代码 的 结束 */ 
F 











图 11-58 写成 完全 可 交换 循环 结构 的 图 11-57 的 代码 


代码 生成 例 程 保证 了 运算 的 执行 都 位 于 原来 的 循环 界限 中 ， 以 保证 新 的 程序 只 执行 原来 代 
码 中 的 运算 。 我 们 可 以 把 这 个 代码 流水 线 化 , 方法 是 把 这 个 三 维 结构 映射 到 二 维 的 处 理 器 空间 
中 。 迁 代 ( 认 ,及 , 达 ) 被 分 配给 四 为 ( 记 , 及 ) 的 处 理 器 。 每 个 处 理 器 执行 循环 下 标 为 如 的 最 内 层 的 
人 循环。 在 它 执行 第 个 迭代 之 前 , 这 个 处 理 器 会 等 待 四 为 ( 记 -1, 认 ) 和 ( 记 , 记 -1) 的 处 理 器 发 来 
的 信号 。 在 它 执行 了 它 的 选 代 之 后 , 它 会 给 处 理 器 ( 认 +1, 六 ) 和 ( 认 , 甩 +1) 发 出 信号 。 o 
11.9.9 ”具有 最 小 同步 量 的 并 行 性 

在 前 面 的 三 节 中 , 我 们 已 经 描述 了 三 个 功能 强大 的 并 行 化 算法 : 算法 11. 43 可 以 找 出 所 有 不 
需要 同步 的 并 行 性 , 算法 11. 54 找 出 了 所 有 只 需要 固定 多 次 同步 的 并 行 性 ,而 算法 11. 59 找 出 了 
所 有 需要 0(n) 次 同步 的 可 流水 线 化 的 并 行 性 , 其 中 是 最 外 层 循环 的 迭代 数量 。 粗 咯 地 说 ,我 
们 的 目标 是 尽 可 能 多 地 把 一 个 计算 过 程 并 行 化 , 同时 尽量 少 地 引入 同步 运算 。 

下 面 的 算法 11. 64 从 最 粗糙 的 并 行 性 粒度 开始 , 找 出 了 一 个 程序 中 存在 的 所 有 并 行 度 。 在 实 
践 中 , 在 为 某 个 多 处 理 器 系统 并 行 化 一 个 代码 时 , 我们 并 不 需要 利用 所 有 层次 上 的 并 行 性 。 我 们 
总 是 利用 最 外 层 的 并 行 性 , 直到 所 有 的 计算 任务 都 被 并 行 化 , 并 且 所 有 的 处 理 器 都 被 完全 利用 
为 止 。 
Pens 找 出 一 个 程序 中 存在 的 所 有 并 行 度 ,同时 所 有 并 行 性 的 粒度 都 尽 可 能 地 粗糙 。 

输入 : 一 个 要 进行 并 行 化 的 程序 。 

输出 : 同一 个 程序 的 并 行 化 版 本 。 
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方法 : 完成 下 列 步骤 : 

1) 找 出 不 需要 同步 运算 的 并 行 性 的 最 大 度数 , 对 这 个 程序 应 用 算法 11. 43。 

2) 找 出 需要 0(1) 次 同步 运算 的 并 行 性 的 最 大 度数 : 对 步骤 1 中 找 出 的 所 有 空间 分 划 单元 应 
用 算法 11. 54。( 如 果 在 步骤 1 中 没有 找到 无 同步 的 并 行 性 , 那么 所 有 的 计算 任务 都 在 同一 个 分 
划 单元 中 。) 

3) 找 出 需要 O(n) 次 同步 运算 的 最 大 并 行 性 度数 。 对 步骤 2 中 找到 的 每 个 分 划 单元 应 用 算 
法 11. 59， 以 找 出 可 流水 线 化 的 并 行 性 。 然 后 对 分 配给 各 个 处 理 器 的 分 划 单元 逐个 应 用 算法 
11. 54。 如果 前 面 没 有 找到 流水 线 化 的 并 行 性 ,就 对 捉 行 循环 的 循环 体 应 用 算法 11. 54。 

4) 在 逐步 增加 同步 度数 的 情况 下 寻找 最 大 的 并 行 性 度数 。 递 归 地 把 步骤 3 应 用 到 上 一 步 生 
成 的 各 个 空间 分 划 单元 中 的 计算 任务 上 。 o 
[加 了 一 现在 让 我 们 回 到 例 11. 56。 算 法 11. 64 的 步骤 1 和 2 都 没有 找到 并 行 性 。 也 就 是 说 ， 
为 了 并 行 化 这 个 代码 , 我 们 需要 的 同步 量 大 于 一 个 常量 。 在 步骤 3 中 , 应 用 算法 11. 59 确定 了 只 
有 一 个 合法 的 外 层 循环 , 这 个 循环 就 是 图 11-53 中 的 原 代码 中 的 循环 。 因 此 ,这 个 循环 不 具有 可 
流水 线 化 的 并 行 性 。 在 步骤 3 的 第 二 部 分 ,我们 应 用 算法 11. 54 来 并 行 化 内 层 循环 。 我 们 像 处 理 
整个 程序 那样 来 处 理 一 个 分 划 单元 中 的 代码 , 不 同 之 处 仅 在 于 我 们 像 处 理 符号 常量 那样 处 理 了 
分 划 单元 的 编号 。 在 这 个 例子 中 ,我 们 发 现 内 层 循环 是 可 并 行 化 的 , 因此 这 个 代码 可 以 使 用 个 
同步 栅 障 进 行 并 行 化 。 口 

算法 11. 64 找 出 了 一 个 程序 中 在 各 个 同步 层面 上 的 并 行 性 。 这 个 算法 优先 求 出 需要 较 少 同 
步 量 的 并 行 化 方案 , 但 是 最 少 同步 运算 并 不 表示 通信 量 是 最 少 的 。 这 里 我 们 讨论 这 个 算法 的 两 
个 扩展 ,以 解决 此 算法 的 弱点 。 

考虑 通信 开销 

如 果 没 有 发 现 无 同步 的 并 行 性 , 算法 11. 64 的 步 又 2 对 每 个 强 连 通 分 量 独立 地 进行 并 行 化 。 
但 是 , 某 些 这 样 的 分 量 仍然 可 能 在 无 同步 和 通信 的 情况 下 被 并 行 化 。 解 决 方法 之 一 是 尽 可 能 地 
在 程序 依赖 图 中 共享 大 部 分 数据 的 子 集 之 间 寻 找 无 同步 的 并 行 性 。 

如 果 强 连通 分 量 之 间 的 通信 是 必须 的 ,我 们 注意 到 有 些 通信 的 开销 要 高 过 其 他 通信 的 开销 。 
比如 , 转 置 一 个 矩阵 的 开销 要 比 两 个 相 邻 处 理 器 之 间 通 信 的 开销 高 得 多 。 假 设 \ 和 ss 分 别 是 两 
个 分 离 的 强 连 通 图 中 的 语句 ,它们 分 别 在 选 代 羡 Mi 中 访问 相同 的 数据 。 如 果 我 们 不 能 分 别 为 
语句 5, 和 sy 找到 分 划 映 射 < Ci ,cl > 和 < Ca ,c > 使 得 


Cy iy + Cy - Cyt, =C) =0 











我 们 就 试图 满足 约束 
Cii +e, -Cih -cs <6 

其 中 6 是 一 个 小 的 常量 。 

用 通信 量 交换 同步 量 

有 些 时 候 , 我 们 宁愿 多 进行 一 些 同步 运算 以 降低 通信 量 。 例 11. 66 讨论 了 一 个 这 样 的 例子 。 
因此 ,如 果 我 们 不 能 在 只 允许 相 邻 的 强 连通 分 量 之 间 进 行 通信 的 情况 下 对 一 个 代码 进行 并 行 化 ， 
我 们 将 试图 把 这 个 计算 任务 流水 线 化 ,而 不 是 独立 地 并 行 化 各 个 分 量 。 如 例 11. 66 所 示 , 流水 线 
化 技术 可 以 被 应 用 到 一 个 循环 序列 中 。 
C 对 于 例 11.49 中 的 ADI 集成 算法 , 我 们 已 经 说 明 对 第 一 和 第 二 个 循环 谋 套 结构 进行 
独立 优化 可 以 在 每 个 嵌 套 结构 中 找到 并 行 性 。 但 是 ,这 样 的 方案 要 求 在 循环 之 间 进 行 矩 阵 转 置 ， 
从 而 出 现 O(n?) 的 数据 流量 。 如 果 我 们 使 用 算法 11. 59 来 寻找 可 流水 线 化 的 并 行 性 ， 就 可 以 把 整 
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个 程序 转换 成 为 一 个 完全 可 交换 的 循环 




















E ER $ a eb >E gk for (j = 0; j n; j++) 
BEAN, MAL 11.59 所 示 。 然 后 , 我 | PG TIT ED | 
们 可 以 应 用 分 块 技术 来 降低 通信 开销 。 if G <n) xiij] = £71,j] + XCi-1,j]) 
这 个 方案 将 带 来 0(n) 次 的 同步 , 但 是 if (j > 0) Xx[i-1,j] = g(XCi-1,j] ,Xti-1,j-1]): 
需要 的 通信 量 要 小 很 多 。 
11.9.10 11.9 节 的 练习 PA 11-59 例 11. 49 的 代码 的 一 个 完全 可 交换 循环 黎 套 结构 
练习 11. 9. 1: 在 11. 9.4 节 中 , 我 们 讨论 了 使 用 倾斜 的 轴 ， 而 不 是 用 水 平 轴 或 垂直 轴 来 将 图 





11-51 中 的 代码 流水 线 化 的 可 能 性 。 对 于 以 下 度数 的 斜 线 , 写 出 和 图 11-52 中 的 循环 类 似 的 代码 : 
@ 135° ,@120°, 
练习 11.9.2: WR b 能 够 整除 4, 那么 图 11-55b 可 以 进一步 简化 。 按 照 这 种 假设 改写 代码 。 
练习 11.9.3: 图 11-60 中 是 一 个 计算 Pascal 三 角形 的 前 100 行 的 程序 。 也 就 是 说 , 对 0<jJ<i<100， 
P[i, 站 将 变 成 从 i 个 物体 中 选择 j 个 物 - 











体 的 方法 总 数 for (i=0; i<100; i++) { 
LEA EN FION P[i,0] = 1; /* s1 */ 
1) 把 这 个 代码 改写 为 单一 的 、 完 全 P[ii = 1; /* s2 */ 
Step By GB as ES E HA } 
可 交换 的 循环 找 套 结构 。 for (i=2; i<100; i++) 
2) 在 一 个 流水 线 中 使 用 100 个 处 理 for (j=1; j<i; j++) 
器 来 实现 这 个 代码 。 为 每 个 处 理 器 写 ea ee 





出 其 代码 , 并 指出 必要 的 同步 运算 。 

3) 使 用 边 长 为 10 个 迭代 的 块 改写 
这 个 代码 。 因 为 迭代 空间 形成 了 一 个 三 角形 , 总 共 只 有 1 +2 +… +10=55 TR. M pi p 作为 
参数 来 表示 一 个 处 理 器 (Pi ,pz ) 的 代码 , 该 处 理 器 被 分 配给 i 方向 上 的 第 pj 个 块 和 j 方 向 上 的 第 
Pz TR. 

练习 11.9.4: 对 图 11-61 中 的 代码 重复 练习 11.9.3。 但 是 请 注意 , 这 个 问题 的 迭代 形成 了 一 
个 边 长 为 100 的 三 维 立 方 体 。 因 此 ， 
间 题 3 中 的 块 应 该 是 10 x10 x10, 县 | for Gros cto: tee) Eoo 
有 1000 个 块 。 Ali,99,0] = Bali]; /* s2 ¥/ 

| 5911.9, 5: 证 我 们 对 二 个 简 | Lo cans jd jae) { 
DA HO B Te] Sal 29 RAY B F A E Yk AL 0,j,0] = B3[j]; /* s3 */ 
11. 59。 在 下 面 的 内 容 中 假设 向 量 i | M8850) SMD] /* sts 
是 (i1 ,1 ), Bi, 是 (i,j,)。 从 技 for (i=0; i<99; i++) 


11-60 计算 Pascal 三 角形 














Sees A a for (j=0; j<99; j++) 
本 上 讲 ,， 这 两 个 向 量 都 是 转 置 的 。 条 for (k=1; k<100; k++) 
He i, <ni 由 下 列子 句 的 析 取 式 A[i,j,k] = 4*A[i,j,k-1] + Ali-1,j,k-1] + 
Ali+1,j,k-1] + A[i,j-1,k-1] + 
构成 : Ali,j+1,k-1]; /* s5 */ 
© ty < 或 者 
isi Bj <h 图 11-61 练习 11. 94 的 代码 
其 他 的 等 式 和 不 等 式 是 


2i +j -10 SO 
in +2j, -20>0 
iy = h +), -50 


Ji =j +40 
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最 后 , | 时 间 分 划 不 等 式 如 下 , 其 中 ci、di .el\c2 .ds 和 ea 为 未 知 量 : 
Cyt, + dyjy +e; ci + dah +09 
1) SAB, Bi, <i, 求解 这 个 时 间 分 划 约 束 。 特 别 地 , 你 需要 尽 可 能 地 消除 ii J i) 和 
h, 并 像 算法 11. 59 中 那样 设置 矩阵 D 和 4。 然 后 对 得 到 的 矩阵 不 等 式 应 用 Farkas 引 理 。 
2) 对 于 情况 @, 即 =, Ai, <b, 重复 问题 1 。 


11.10 局 部 性 优化 


不 管 一 个 处 理 器 是 不 是 某 个 多 处 理 器 系统 的 一 部 分 , 它 的 性 能 和 它 的 高 速 缓存 的 行为 密切 
相关 。 高 速 缓 存 中 的 脱 轰 可 能 要 花费 几 十 个 时 钟 周 期 ， 因 此 高 速 缓存 的 高 脱 靶 率 会 使 处 理 器 性 
能 降低 。 在 带 有 公共 内 存 总 线 的 多 处 理 器 系统 的 背景 下 ,对 总 线 的 竞争 会 进一步 加 剧 低劣 的 数 
据 局 部 性 所 带 来 的 损失 。 

我 们 将 看 到 ， 即 使 我 们 只 是 希望 提高 单 处 理 器 系统 的 数据 局 部 性 , 用 于 并 行 化 的 仿 射 分 划算 
法 也 是 有 用 的 。 它 是 一 个 有 效 的 寻找 循环 转换 机 会 的 工具 。 在 本 节 中 , 我 们 描述 了 三 种 在 单 处 
理 器 系统 和 多 处 理 器 系统 中 提高 数据 局 部 性 的 技术 。 

1) 我 们 试图 在 计算 结果 生成 之 后 尽快 地 使 用 它们 ， 以 提高 计算 结果 的 时 间 局 部 性 。 提 高 时 
间 局 部 人 性 的 方法 是 把 一 个 计算 任务 分 割 成 为 独立 的 分 划 单 元 , 并 把 各 个 分 划 单 元 中 具有 依赖 关 
系 的 运算 紧 靠 在 一 起 执行 。 

2) 数组 收缩 (array contraction) 技术 降低 了 一 个 数组 的 维度 ,， 且 降低 了 被 访问 内 存 位 置 的 数 
月。 如 果 在 任意 给 定时 刻 该 数组 只 有 一 个 位 置 被 使 用 , 我 们 就 可 以 应 用 数组 收缩 技术 。 

3) 除了 提高 计算 结果 的 时 间 局 部 性 , 我 们 也 需要 优化 计算 结果 的 空间 局 部 性 , 同时 优化 只 
读数 据 的 时 间 和 空间 局 部 性 。 我 们 可 以 交 革 执行 多 个 分 划 单 元 ,而 不 是 一 个 接 一 个 地 执行 它们 。 
这 样 做 可 以 使 得 分 划 单 元 之 间 的 复 用 更 加 靠近 。 

11. 10. 1 计算 结果 数据 的 时 间 局 部 性 

仿 射 分 划算 法 把 所 有 相互 依赖 的 运算 放 到 一 起 。 通 过 串 行 执行 这 些 分 划 , 我 们 提高 了 计算 
结果 数据 的 时 间 局 部 性 。 让 我 们 回顾 一 下 11.7.1 节 中 讨论 的 多 网 格 的 例子 。 应 用 算法 11. 43 来 
并 行 化 图 11-23 中 的 代码 , 找到 了 2 度 的 并 行 性 。 图 11-24 中 的 代码 包含 两 个 外 层 循 环 ， 它 们 顺 
序 遍 历 了 各 个 独立 的 分 划 单 元 。 转 换 得 到 的 这 个 代码 具有 较 好 的 局 部 性 ,因为 计算 得 到 的 结果 
立刻 就 在 同一 个 迭代 中 使 用 。 

因此 , 即使 我 们 的 且 标 是 优化 顺序 执行 ,使 用 并 行 化 技术 找 出 这 些 相关 的 运算 并 把 它们 放 到 
一 起 也 是 很 有 好 处 的 。 我 们 在 这 里 使 用 的 算法 和 算法 11. 64 类 似 , 它 从 最 外 层 循环 开始 寻找 所 有 
的 并 行 性 粒度 。 如 11. 9. 9 节 中 讨论 的 , 如 果 我 们 在 每 个 层次 上 都 不 能 找到 无 同步 的 并 行 性 , 这 
个 算法 就 对 各 个 强 连 通 分 量 单独 进行 并 行 化 。 这 个 并 行 化 方法 常常 会 增加 通信 量 。 因 此 , 如果 
被 单独 并 行 化 的 强 连通 分 量 之 间 存 在 复 用 , 我 们 就 尽 可 能 地 把 它们 组 合 起 来 。 

11. 10.2 ”数组 收编 

数组 收缩 优化 给 出 了 另 一 个 在 存储 和 并 行 性 之 间 进 行 折 衷 处 理 的 例子 。 这 种 折 囊 方案 首先 
在 10.2.3 节 中 讨论 指令 级 并 行 性 时 引入 。 使 用 更 多 寄存 器 可 以 得 到 更 大 的 指令 级 并 行 性 。 同 
E, 使 用 更 多 的 内 存 可 以 得 到 更 多 的 循环 级 并 行 性 。 如 11.7.1 节 中 的 多 网 格 例子 所 示 , 把 一 个 
临时 的 标量 变量 变 成 一 个 数组 就 可 以 允许 不 同 的 迭代 使 用 这 个 临时 变量 的 不 同 实例 , 也 就 允许 
它们 同时 执行 。 反 过 来 ,如 果 我 们 有 一 个 每 次 只 操作 一 个 数组 元 素 的 顺序 执行 过 程 ,就 可 以 收缩 
这 个 数组 , 把 它 蔡 换 为 一 个 标量 , 并 让 各 个 迁 代 使 用 同一 个 位 置 。 
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在 图 11-24 中 显示 的 转换 得 到 的 多 网 格 程序 中 , 内 层 循环 的 每 个 迭代 生成 并 消耗 了 4P、4M、 








TAR D 的 一 行 中 的 不 同 元 
a ey ee age for (j = 2, j <= jl, j++) 
素 。 如 果 这 些 数组 不 会 在 这 个 | oT ia 
代码 段 之 外 使 用 , CRETE AR BE = ae ee 
eee rae ae eve evs Pte = 1.0/(1.0 +AP); 
可 以 串 行 地 复 用 同一 个 数据 存 D[2] = TAP; 
储 位 置 ， 而 不 是 把 这 些 值 分 别 Dit, 2.444) = THDWCE, 2,4 415 
Stoves or (k=3, <= kl-1, k++ 

存放 在 不 同 的 元 素 中 或 者 不 同 AM = AP; 
行 中 。 图 11-62 显示 了 减少 这 ae -AM*D[k-1]...; 
些 数组 的 维度 之 后 的 结果 。 这 DEK] = Tehp; 
个 代码 比 原来 的 代码 运行 得 更 . DW[1,k,j,i] = be ea 
快 , 因为 它 读 写 的 数据 更 少 。 si 

JA A ge aa a 2 ig for (k=kl-1, k>=2, k--) 
特别 是 当 一 个 数组 被 归 约 成 一 DW[i,k, j,i] = DW[1,x, j,i] +D[K]*DW [1,k+1,j,i]; 
个 标量 变量 时 , 我 们 可 以 把 这 } 





个 变量 放 在 一 个 寄存 器 中 , 并 
完全 消除 了 对 内 存 访问 的 
需求 。 

因为 使 用 的 内 存 更 少 , 所 以 可 用 的 并 行 性 也 变 少 了 。 转 换 得 到 的 图 11-62 中 的 代码 的 先 
代 之 间 有 了 数据 依赖 关系 , 因此 不 能 再 并 行 执行 。 为 了 把 代码 在 P 个 处 理 器 上 并 行 执行 ,我 
们 可 以 把 每 个 标量 变量 扩展 出 已 个 副本 ,并 让 每 个 处 理 器 访问 自己 的 副本 。 这 样 ， 内 存 扩展 
的 数量 就 和 被 利用 的 并 行 性 直接 相关 了 。 

通常 , 要 寻找 数组 收缩 机 会 的 理由 有 三 个 : 

1) 用 于 科学 应 用 的 高 级 程序 设计 语言 ( 比如 Matlab 和 Fortran90) 支持 数组 层次 的 运算 。 数 组 
运算 的 每 个 子 表 达 式 都 生成 一 个 临时 数组 。 因 为 这 些 数组 可 能 很 大 , 每 个 数组 运算 ,比如 乘法 或 
加 法 , 需要 读 写 很 多 内 存 位 置 ,同时 对 算术 运算 的 需求 相对 较 少 。 因 此 , 我 们 对 运算 进行 重新 排 
序 以 便 数据 被 生成 后 立刻 就 被 消耗 掉 , 同时 也 就 把 这 些 数组 收缩 成 了 标量 变量 。 这 样 的 处 理 是 
很 重要 的 。 

2) 在 20 世纪 80 和 90 年 代 构 造 的 超级 计算 机 都 是 向 量 机 , 因此 那 时 开发 的 很 多 科学 计算 
应 用 都 是 针对 这 样 的 机 器 进行 优化 的 。 虽 然 存在 向 量化 编译 器 ,但 很 多 程序 员 依 然 把 他 们 的 
代码 写成 每 次 完成 一 次 向 量 运算 的 方式 。 本 章 中 多 网 格 代码 的 例子 就 是 这 种 风格 的 程序 的 
例子 。 

3) 收缩 优化 的 机 会 也 会 由 编译 器 引入 。 如 多 重 网 格 例子 中 的 变量 了 所 演示 的 ,一 个 编译 器 
可 能 会 扩展 数组 以 提高 并 行 性 。 如 果 这 种 空间 扩展 是 不 必要 的 , 那么 我 们 就 必须 对 这 个 数组 进 
行 收缩 处 理 。 
数组 表达 式 Z = 多 + 不 + 了 被 翻译 成 为 


for (i=0; i<n; i++) T[i] = W[i] + X[i]; 
for (i=0; i<n; i++) Z[i] = T[i] + Y[i]; 


把 这 个 代码 改写 成 

for (i=0; i<n; i++) { T = Wi + X[i]; zi = T + Y[i] } 
可 以 极 大 地 提高 代码 的 运行 速度 。 当 然 , 在 C 代码 的 层次 上 我 们 甚至 不 需要 使 用 临时 变量 了 ,而 
是 可 以 把 对 2[ 订 的 赋值 语句 写成 单个 语句 。 但 这 里 我 们 正 试图 对 中 间 代 码 层次 进行 建 模 。 在 这 
个 层次 上 一 个 向 量 处 理 器 将 会 处 理 这 些 运算 。 as 





图 11-62 ”对 图 11-23 进行 分 划 ( 图 11-24) 和 
数组 收缩 之 后 的 得 到 的 代码 
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rid 11. 08 数组 收缩 。 
输入 : 一 个 由 算法 11. 64 转换 得 到 的 程序 。 
输出 : 一 个 等 价 的 程序 , 但 降低 了 数组 的 维度 。 
方法 : 一 个 数组 的 维度 可 以 被 收缩 为 一 个 元 素 的 条 件 如 下 : 
1) 每 个 独立 的 分 划 单元 只 使 用 这 个 数组 的 一 个 元 素 。 

2) 这 个 元 素 在 分 划 单元 人 口 处 的 值 没有 被 这 个 分 划 单 元 使 用 , B. 

3) 这 个 元 素 的 值 在 这 个 单元 的 出 口 处 不 活跃 。 

找 出 可 收缩 的 维度 ,也 就 是 满足 上 面 三 个 条 件 的 维度 , 并 把 它们 蔡 换 为 单个 元 素 。 口 

算法 11. 68 假设 这 个 程序 首先 由 算法 11. 64 进行 转换 , 把 所 有 相互 依赖 的 运算 都 分 配 到 同一 
个 分 划 单元 中 , 并 顺序 地 执行 这 些 分 划 单 元 。 它 找 出 了 其 元 素 在 不 同 迭 代 中 活跃 范围 不 相交 的 
数组 变量 。 如 果 这 些 变量 在 循环 之 后 不 再 活跃 , 它 就 可 以 收缩 这 个 数组 并 让 处 理 器 在 同一 个 标 
量 位 置 上 进行 运算 。 在 数组 收缩 之 后 ,可 能 还 有 必要 选择 性 地 扩展 一 些 数组 ,以 应 对 并 行 性 和 其 
他 局 部 性 优化 问题 。 

这 里 要 进行 的 活路 性 分 析 比 9. 2. 5 节 中 所 描述 的 分 析 更 加 复杂 。 如 果 数 组 被 定义 为 一 个 全 
局 变量 , 或 者 它 是 一 个 参数 , 我 们 就 需要 使 用 过 程 间 分 析 技 术 来 像 证 不 使 用 出 口 处 的 值 。 不 仅 如 
此 , 我 们 还 需要 计算 单个 数组 元 素 的 活跃 性 , 保守 地 把 数组 当 作 一 个 标量 进行 活跃 性 分 析 会 使 结 
果 不 够 精确 。 

11.10.3 分 划 单 元 的 交织 

一 个 循环 中 的 不 同 分 划 单元 经 常 读 取 同 样 的 数据 ,或 者 读 写 同样 的 高 速 缓存 线 。 在 本 节 和 
接 下 来 的 两 节 中 , 我们 将 讨论 当 发 现 了 分 划 单元 之 间 的 复 用 时 如 何 优化 局 部 性 

最 内 层 块 的 复 用 

我 们 采用 一 个 简单 的 模型 ， 即 如 果 一 个 数据 在 少量 迭代 之 后 就 被 复 用 , 那么 就 可 以 在 高 速 组 

存 中 找到 这 个 数据 。 如 果 最 内 层 循环 具有 很 大 或 未 知 的 界限 , 那么 只 有 最 内 层 循 环 的 迭代 之 间 
的 复 用 才能 够 带 来 更 好 的 局 部 性 。 分 块 处 理 过 程 创 建 了 具有 较 小 且 已 知 界限 的 内 层 循环 , 使 得 
我 们 可 以 充分 利用 整个 计算 块 之 内 或 块 之 间 的 复 用 。 因 此 ,分 块 技 术 具有 促进 更 多 维度 复 用 的 
作用 。 
RMR Moen 考虑 图 11-5 中 显示 的 矩阵 乘法 代码 以 及 图 11-7 中 该 代码 的 分 块 版 本 。 和 矩阵 乘法 在 
它 的 三 维 迭 代 空间 中 的 每 一 个 维度 上 都 有 复 用 。 在 原来 的 代码 中 ,最 内 层 循环 具有 n 个 迭代 , 其 
Hn ERAD, 且 可 能 很 大 。 我 们 的 简单 模型 假设 只 有 跨越 最 内 层 循环 迭代 的 被 复 用 数据 才 可 
以 在 高 速 缓存 中 找到 。 

在 分 块 版 本 中 , 最 内 层 的 三 个 循环 执行 了 一 个 三 维 的 计算 任务 块 。 这 个 三 维 块 的 每 条 边 长 
都 是 8 个 迭代 。 这 个 块 的 大 小 是 由 编译 器 选择 的 。 这 个 大 小 必须 足够 小 , 使 得 在 计算 分 块 时 读 
写 的 所 有 高 速 缓存 线 能 够 一 起 放 到 高 速 缓存 中 。 因 此 , 跨越 自 外 而 内 的 第 三 层 循环 的 迭代 的 复 
用 数据 可 以 在 高 速 缓存 中 找到 。 口 

我 们 把 具有 较 小 且 已 知 界限 的 最 内 层 循环 集合 称 为 最 内 层 分 决 (innermmost block ) WRAT 
能 , 我 们 期 望 最 内 层 块 包含 所 有 可 能 带 有 数据 复 用 的 迁 代 空间 的 维度 。 把 分 块 边 长 最 大 化 并 不 
重要 。 以 矩阵 乘法 为 例 , 三 维 分 块 技术 把 对 每 个 矩阵 的 数据 访问 量 降低 了 B 倍 。 如 果 存 在 数据 
复 用 , 使 用 高 维度 小 边 长 的 分 块 要 比 低 维度 大 边 长 的 分 块 更 好 。 

我 们 可 以 对 具有 复 用 关系 的 循环 进行 分 块 , 从 而 优化 最 内 层 完 全 可 交换 循环 嵌 套 结构 的 局 
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部 性 。 我 们 也 可 以 把 分 块 概念 泛 化 ,以 利用 在 较 外 层 并 行 循环 的 迭代 之 间 找 到 的 复 用 。 请 注意 ， 
分 块 技术 主要 是 交错 地 执行 内 层 循 环 的 少量 实例 。 在 和 矩阵 乘法 中 , 最 内 层 循 环 的 每 个 实例 计算 
出 结果 数组 的 一 个 元 素 , 总 共有 n 个 这 样 的 元 素 。 分 块 技术 把 一 个 块 的 实例 执行 交织 起 来 ， 每 
次 计算 每 个 实例 中 的 8B 个 迭代 。 类 似 地 , 我 们 可 以 把 并 行 循 环 中 的 迭代 交 苦 执行 , 以 利用 它们 之 
间 的 数据 复 用 。 : 

下 面 我 们 定义 了 两 个 基本 方法 , ATT A ARRE ae a PY Se WER. RITARI 
循环 开始 反复 应 用 这 两 个 基本 方法 ， 直 到 所 有 的 复 用 都 被 移动 到 最 内 层 块 的 相 邻 位 置 上 。 

在 一 个 并 行 循环 中 交织 内 层 循环 

考虑 一 个 外 层 可 并 行 化 循环 包含 一 个 内 层 循环 的 情况 。 为 了 利用 外 层 循 环 迭 代 之 问 的 数据 
复 用 , 我 们 把 固定 多 个 内 层 循环 的 实例 交织 在 一 起 执行 , 如 图 11-63 所 示 。 通 过 创建 二 维 内 层 分 
块 ， 这 个 转换 降低 了 外 层 循环 的 连续 迁 代 之 间 的 数据 复 用 之 间 的 距离 。 




















for (ii=0; ii<n; ii+=4) 


for (i=0; i<n; i++) for (j=0; j<n; j++) 
for (j20; j<n; j++) for (i=ii; i<min(n, ii+4); i++=4) 
<S> <S> 


iad b) 转换 得 到 的 代码 








图 11-63 ”把 内 层 循环 的 4 个 实例 交织 执行 


把 一 个 循环 
for (i=0; i<n; i++) 
<S> 
变 成 


for (ii=0; ii<n; ii+=4) 
for (i=ii; ii<min(m, ii+4); ii+=4) 
<S> 

的 步骤 称 为 条 状 挖 握 (stripmining)。 当 图 11-63 中 的 外 层 循 环 的 界限 较 小 且 已 知 时 ,我 们 不 需要 
对 它 进 行 条 状 挖掘 ， 而 是 直接 交换 原 程 序 中 的 两 个 循环 。 

交织 执行 一 个 并 行 循 环 中 语句 

考虑 一 个 可 并 行 化 循环 包含 一 个 语句 序列 sl ,s; ,… ,sm 的 情况 。 如 果 其 中 的 一 些 语 句 本 身 也 
是 循环 , 那么 连续 迭代 的 语句 之 间 可 能 还 是 相隔 了 很 多 运算 。 我 们 可 以 使 用 交织 运行 这 些 语句 
的 方法 来 利用 迭代 之 间 的 数据 复 用 , 如 图 11-64 所 示 。 这 个 转换 在 不 同 的 语句 之 间 分 布 那 些 经 过 
了 条 状 挖掘 的 循环 。 如 果 外 层 循 环 只 有 少量 的 固定 多 个 送 代 , 我 们 不 需要 对 循环 进行 条 状 挖掘 ， 
而 是 直接 在 各 个 语句 上 分 布 原来 的 循环 。 

















for (ii=0; ii<n; ii+=4) { 
for (i=ii; i<min(n,iit4); i++) 
for (i=0; i<n; i++) { <Si> 
<S1> for (i=ii; i<min(n,ii+4); i++) 
<S2> <S2> 
} | } 
a) 源 程 序 b) 转换 后 的 代码 


图 11-64 交织 语句 的 转换 
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我 们 使 用 s;()) 来 表示 语句 s; 在 第 j 个 迭代 中 的 运行 。 代 码 的 执行 不 是 按照 图 11- 65a 中 显示 
的 原 执行 顺序 ， 而 是 按照 图 11-65b 中 显示 的 顺序 执行 。 

s1(0)， s2{0),，... ， snm(0)， sı (0), s: (1), 51 (2), sı (3) 

8i(1), A) a sm(l), s2 (0), s2 (1), sa (2), 2 (3) 

s2) s2(2), i 8m(2), 

s1 (8), s2(3), e’ 8m(3), Sm (0), 8m(1), sm(2), S n (3) 

s\(4), 8s2(4)，...， sm(4), sı (4), sı (5), sr (6), sı (7) 

$1(5), s2(5) ...， sm(5), s2 (4), s2 (5), s2 (6), s2 (7) 

sı (6), sa(6), sry Sm(6), ’ 

sy(7), s2{7), sm(7), sm (4), smn(5), sm(6), sm(7) 

a) RADHA RE b) 转换 得 到 的 顺序 


图 11-65 ”分布 一 个 经 过 条 状 挖掘 的 循环 








AUO 我 们 现在 回 到 多 网 格 的 例子 , 说 明 如 何 利用 外 层 并 行 循环 的 迭代 之 间 的 数据 复 用 。 
我 们 观察 到 , 图 11-62 的 代码 的 最 内 层 循 环 中 的 引用 DWL1,k,j,i]、DWIL1,k-1,j,i] 和 DW[L1, 
+1,j, 让 的 空间 局 部 性 很 差 。 根 据 11. 5 节 中 讨论 的 复 用 分 析 可 知 , 下 标 变 量 为 i 的 循环 具有 空 
间 局 部 性 , 而 下 标 为 的 循环 具有 组 复 用 性 。 下 标 为 的 循环 已 经 是 最 内 层 循环 了 ,因此 我 们 感 
兴趣 的 是 交织 执行 来 自 一 个 具有 连续 i 值 的 分 划 块 中 的 对 DW 的 运算 。 

我 们 应 用 这 个 转换 来 交织 这 个 循环 中 的 语句 , 得 到 图 11-66 中 的 代码 , 然后 应 用 这 个 转换 来 
交织 内 层 循环 , 得 到 图 11-67 中 的 代码 。 请 注意 ， 当 我 们 把 来 自 下 标 为 i 的 循环 的 8 个 迭代 交错 
执行 时 , 我 们 需要 把 变量 AP 4M、T 了 扩展 为 数组 ,以 便 一 次 存放 B 个 结果 。 口 























for (j = 2, j <= jl, j++) 
for (ii = 2, ii <= il, iit=b) { 
for (i = ii; i <= min(iitb-1,il1); i++) { 


ib = i-iitt; 

AP Lib] Bs 

T = 1.0/(1.0 +AP[ib]); 
D[2,ib] = T*AP([ib]; 
DW[1,2,j,4] = T*DW[1,2,j,i]; 


for (i = ii; i <= min(iitb-1,i1); i++) { 
for (k=3, k <= kl-1, k++) 


ib = i-ii+1; 

AM = AP[ib]; 

AP [ib] = ..,; 

T = ...AP[ib]-AM*D[ib,k-1]...; 
D[ib,k] = TAP; 


DW[1,k,j,4] = T*(W[1,k,j,i]4DW[1,k-1,j,i])...; 
iy 


for (i = ii; i <= min(ii+tb-1,i1); i++) 
for (k=kl-1, k>=2, k--) { 
DW[1,k,j,i] = DW[1,k,j,i] +D[iw,k] *DW[1,k+1,j,i]; 
/* Ends code to be executed by processor (j,i) */ 








图 11-66 对 图 11-23 的 代码 进行 分 划 、 数组 收缩 、 内 层 循环 交错 和 分 块 后 所 得 的 部 分 代码 


并 行 性 和 局 部 性 优化 








for (j = 2, j <= jl, j++) 
for (ii = 2, ii <= il, ii+=b) { 
for (i = ii; i <= min(iitb-1,i1); i++) { 


ib = i-iit+t; 

AP [ib] = 

T = 1.0/(1.0 +AP[ib]); 
D[2,ib] = T*AP[ib]; 
DW[1,2,j,i] = T*DW[1,2,j,i]; 


} 
for (k=3, k <= kl-1, k++) 
for (i = ii; i <= min(iitb-1,i1); i++) { 


ib = i-ii+1; 
AM = AP[ib]; 

AP[ib] 三 

T = ...AP[ib]-AM*D[ib,k-1]...; 
D{ib,k] = TAP; 

DWL1,k,j,i] = T*(DWL1,k,j,i]+DW[1,k-1,j,i])...; 


} 


for (k=ki-1, k>=2, k--) { 
for (i = ii; i <= min(ii+b-1,i1); i++) 
DW[1,k, j,i] = DW[1,k,j,i] +D[iw,k]*DW[1,k+1, j,i]; 
/* Ends code to be executed by processor (j,i) */ 
} 
} 











图 11-67 ”对 图 11-23 的 代码 进行 分 划 、 数 组 收缩 和 分 块 后 所 得 的 部 分 代码 


11. 10.4 合成 

算法 11.71 对 一 个 单 处 理 器 系统 的 局 部 性 进行 了 优化 , 而 算法 11. 72 则 对 一 个 多 处 理 器 系统 
的 并 行 性 和 局 部 性 进行 了 优化 。 
在 一 个 单 处 理 器 系统 上 优化 数据 局 部 性 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 : 一 个 最 大 化 数据 局 部 性 的 等 价 程序 。 

方法 : 执行 下 列 步 又; 

1) 应 用 算法 11. 64 来 优化 计算 结果 的 时 间 局 部 性 。 

2) 应 用 算法 11. 68 在 可 能 的 时 候 收 缩 数 组 。 

3) 利用 11.5 节 中 描述 的 技术 , 确定 可 能 共享 相同 数据 或 高 速 缓 存 线 的 迭代 子 空间 。 对 于 每 
个 语句 , 找 出 具有 数据 复 用 的 外 层 并 行 循 环 的 维度 。 

4) 对 每 个 带 有 数据 复 用 的 外 层 并 行 循环 , 重复 使 用 基本 的 交织 方法 ,把 一 个 迭代 分 块 移动 
到 最 内 层 块 中 。 

5) 对 位 于 那些 带 有 复 用 的 最 内 层 的 完全 可 交换 循环 中 的 维度 的 子 集 应 用 分 块 技 术 。 

6) 对 外 层 完全 可 交换 循环 媒 套 结构 进行 分 块 , 其 目的 是 利用 内 存 层次 结构 中 的 更 高 层 存 储 
设备 ， 比 如 第 三 层 高 速 缓存 或 物理 内 存 。 

7) 在 必要 的 地 方 按照 块 的 边 长 扩展 标量 或 者 数组 。 口 
CRAE 针对 多 处 理 器 系统 优化 并 行 性 和 数据 局 部 性 。 

输入 : 一 个 带 有 仿 射 数组 访问 的 程序 。 

输出 ; 一 个 最 大 化 并 行 性 和 数据 局 部 性 的 等 价 程序 。 

方法 : 执行 下 列 步 又 : 








566 #118 





1) 使 用 算法 11. 64 对 这 个 程序 进行 并 行 化 , 并 创建 一 个 SPMD 程序 。 


11. 10.5 11. 10 节 的 练习 
练习 11. 10. 1: 对 下 面 的 向 量 运算 进行 数组 收缩 变换 : 


for (i=0; i<n; i++) T[i] = A[i] * B[i]; 
for (i=0; i<n; i++) D[i] = T[i] + C[i]; 


练习 11.10. 2: 对 下 面 的 向 量 运 算 进 行 数组 收缩 变换 : 
for (i=0; i<n; i++) T[i] = Afi] + B[i]; 
for (i=0; i<n; i++) S[i] = C[i] + D[i]; 
for (i=0; i<n; i++) Efi] = T[i] * s[i]; 


练习 11. 10.3: 以 10 为 宽度 对 下 面 的 外 层 循 环 进行 条 状 挖掘 : 


for (i=n-1; i>=0; i--) 
for (j=0; j<n; j++) 


11.11 仿 射 转换 的 其 他 用 途 


至 今 为 止 , 我 们 的 注意 力 都 集中 在 共享 内 存 的 计算 机 体系 结构 上 ; 但 是 仿 射 循环 转换 的 理论 
还 有 很 多 其 他 的 应 用 。 我 们 可 以 把 仿 射 转换 应 用 到 其 他 形式 的 并 行 性 上 , 包 插 分 布 式 内 存 计算 
机 、 向 量 指令 、SIMD(Single Instruction Multiple Data, 单 指令 多 数据 ) 指 令 以 及 多 指令 发 送 计算 机 
等 。 本 章 中 介绍 的 复 用 分 析 技 术 也 可 以 用 于 数据 预 取 (prefetching)。 数 据 预 取 是 一 个 可 以 提高 内 
存 性 能 的 有 效 技术 。 

11. 11. 1 分布 式 内 存 计算 机 

在 分 布 式 内 存 计 算 机 中 , 处 理 器 通过 发 送 消 息 和 其 他 处 理 器 进行 通信 。 对 于 这 类 机 器 ,给 各 
个 处 理 器 分 配 大 型 的 ,独立 的 计算 单元 显得 更 加 重要 。 仿 射 分 划算 法 可 以 生成 这 样 的 单元 。 除 了 
计算 任务 的 分 划 , 还 存在 其 他 一 些 编译 问题 需要 处 理 : 

1) 数据 分 配 。 如 果 处 理 器 使 用 的 是 一 个 数组 的 不 同 部 分 , 每 一 个 处 理 器 只 需要 分 配 足 够 的 
空间 以 存放 各 自 使 用 的 部 分 。 我 们 可 以 使 用 投影 的 方式 来 决定 每 个 处 理 器 使 用 数组 的 哪个 部 分 。 
在 决定 数据 分 配 时 , 输入 是 一 个 线性 不 等 式 系统 , 该 系统 表示 循环 界限 , 数组 访问 函数 , 以 及 把 
迭代 上 映射 到 处 理 器 ID 的 仿 射 分 划 。 我 们 通过 投影 消除 循环 下 标 , 并 找 出 每 个 处 理 器 ID 所 使 用 的 
数组 位 置 。 

2) 通信 代码 。 我 们 需要 明确 生成 向 其 他 处 理 器 发 送 以 及 从 其 他 处 理 器 接收 数据 的 代码 。 在 
每 个 同步 点 上 ， 

D 确定 存放 在 某 个 处 理 器 上 和 且 其 他 处 理 器 需要 使 用 的 数据 。 

© 生成 具有 如 下 功能 的 代码 ; 找 出 所 有 将 被 发 送 的 数据 并 把 它们 打包 放 到 一 个 缓冲 区 中 。 

®© 类 似 地 , 确定 这 个 处 理 器 需要 的 数据 , 解 开 接收 到 的 消息 的 数据 包 , 把 数据 移动 到 适当 的 
内 存 位 置 。 

如 果 所 有 的 访问 都 是 仿 射 的 , 那么 这 些 任务 仍然 可 以 由 编译 器 使 用 仿 射 框架 来 完成 。 

3) 优化 。 并 不 是 所 有 的 通信 都 必须 在 同步 点 上 进行 。 比 较 好 的 做 法 是 每 个 处 理 器 在 数据 可 
用 时 立刻 发 送 数据 ,而 每 个 处 理 器 只 有 在 需要 数据 时 才 开 始 等 待 。 必 须 对 这 个 优化 和 另 一 个 目 
标 ( 即 不 能 生成 太 多 消息 ) 加 以 权衡 ， 因 为 处 理 每 个 消息 的 开销 都 比较 大 。 

这 里 描述 的 技术 还 有 其 他 用 途 。 比 如 , 一 个 专用 的 骨 人 式 系统 可 能 使 用 协 处 理 器 来 减轻 
某 些 计算 负 担 。 岩 人 式 系统 也 可 能 使 用 一 个 独立 的 控制 器 把 数据 加 载 进 高 速 缓存 或 其 他 数据 
缓冲 区 , RATH, 而 不 是 自己 要 求 把 数据 调 人 高 速 缓存 ; 在 独立 控制 器 调动 数据 时 , 处 理 
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器 可 同时 在 其 他 数据 上 执行 运算 。 在 这 些 情 况 下 ,我们 可 以 使 用 类 似 的 技术 来 生成 移动 数据 
的 代码 。 
11. 11.2 多 指令 发 送 处 理 器 

我 们 也 可 以 使 用 仿 射 循环 转换 来 优化 多 指令 发 送 计 算 机 的 性 能 。10. 5 节 讨 论 过 , 一 个 软件 
流水 线 化 循环 的 性 能 受到 两 个 因素 的 限制 : 先后 关系 约束 中 的 环 ， 以 及 对 关键 资源 的 使 用 。 通 过 
改变 最 内 层 循 环 的 组 成 , 我 们 可 以 改进 这 些 限 制 。 

首先 ,我 们 可 以 使 用 循环 转换 来 创立 最 内 层 的 可 并 行 化 循环 , 从 而 完全 消除 先后 关系 约束 中 
的 环 。 假 设 一 个 程序 有 两 个 循环 ,其 中 的 外 层 循环 是 可 并 行 化 的 ， 而 内 层 循环 不 可 并 行 化 。 我 们 
可 以 交换 这 两 个 循环 ,使 得 内 层 循环 变 成 可 并 行 化 的 ,从 而 创造 出 更 多 的 指令 级 并 行 化 机 会 。 请 
注意 , 我 们 并 不 要 求 最 内 层 循环 的 迭代 之 间 一 定 是 完全 可 并 行 化 的 。 只 要 其 依赖 关系 所 确定 的 
环 短 到 可 以 充分 利用 硬件 资源 就 足够 了 。 

我 们 也 可 以 通过 改进 一 个 循环 中 资源 使 用 的 平衡 性 来 放松 因 资 源 使 用 而 引起 的 限制 。 假 设 
一 个 循环 只 使 用 加 法 器 ， 而 另 一 个 只 使 用 乘法 器 。 假 设 一 个 循环 因为 内 存 而 受到 制约 , 另 一 个 循 
环 因为 计算 量 而 受到 制约 。 比 较 好 的 做 法 是 把 这 些 例 子 中 的 循环 对 融合 到 一 起 , 以便 同时 充分 
利用 所 有 的 功能 单元 。 
11. 11.3 ASM SIMD 指令 


除了 多 指令 问题 之 外 , 还 有 其 他 两 种 重要 的 指令 级 并 行 性 : 向 量 和 SIMD 运算 。 在 这 两 种 情 
AF, 发 送 一 个 指令 可 以 对 一 个 数据 向 量 的 所 有 元 素 进 行 相同 运算 。 

前 面 提 到 过 ,很 多 早期 的 超级 计算 机 使 用 了 向 量 指令 。 向 量 运算 以 流水 线 化 的 方式 执行 ,该 
向 量 的 元 素 被 串 行 获取 , 对 不 同 元 素 的 计算 相互 重 善 。 在 先进 的 向 量 计算 机 中 , 向 量 运算 可 以 链 
接 起 来 : 当 生 成 结果 向 量 的 元 素 时 ,它们 立刻 被 男 一 个 向 量 指令 的 运算 消耗 掉 , 不 需要 等 待 所 有 
的 结果 都 计算 完成 。 不 仅 如 此 , 在 具有 散播 /收集 (scatter/gather) 硬 件 的 先进 计算 机 中 ,向量 的 元 
素 不 要 求 是 连续 的 , 可 以 用 一 个 下 标 向 量 确定 这 些 元 素 该 放 在 那里 。 

SIMD 指令 指定 了 对 连续 内 存 位 置 执行 的 相同 运算 。 这 些 指 令 从 内 存 中 并 行 加 载 数据 ,把 它 
们 存放 在 宽 寄存 器 中 , 并 使 用 并 行 硬件 来 计算 它们 。 很 多 媒体 .图形 和 数字 信号 处 理应 用 可 以 利 
用 这 些 运算 。 低 端 媒 体 处 理 器 只 需要 一 次 发 射 一 个 SIMD 指令 就 可 以 获得 指令 级 并 行 性 。 高 端 处 
理 器 可 以 把 SIMD 和 多 指令 发 射 结合 起 来 以 获取 更 好 的 性 能 。 

SIMD 及 向 量 指令 生成 和 数据 局 部 性 优化 之 间 具 有 很 多 相似 性 。 当 我 们 找到 在 连续 内 存 位 
置 上 运算 的 独立 分 划 单元 时 ,就 对 这 些 迭 代 进 行 条 状 挖掘 ,并 把 最 内 层 循环 中 的 运算 交织 
起 来 。 

生成 SIMD 指令 有 两 个 难点 。 首 先 , 有 些 机 器 要 求 从 内 存 中 获取 的 SIMD 数据 是 位 对 齐 的 。 
比如 , 它们 可 能 要 求 将 256 字 节 的 SIMD 运算 分 量 放 在 为 256 的 倍数 的 地 址 上 。 如 果 源 循环 只 在 
一 个 数据 数组 上 运算 , 我 们 可 以 生成 一 个 主 循环 来 处 理 对 齐 的 数据 ， 而 这 个 循环 的 前 面 和 后 面 都 
有 附加 的 代码 来 计算 边界 上 的 元 素 。 但 是 对 于 在 多 个 数组 上 运算 的 循环 , 就 有 可 能 无 法 同时 对 
齐 所 有 的 数据 。 第 二 , 一 个 循环 的 连续 迭代 所 使 用 的 数据 可 能 不 是 连续 的 。 这 种 例子 包括 很 多 
重要 的 数字 信号 处 理 的 算法 ， 比 如 Viterbi 解码 器 和 快速 傅 里 叶 变 换 。 要 利用 SIMD 指令 的 话 , 有 
可 能 需要 一 些 额 外 的 用 于 移动 数据 的 指令 。 


11. 11.4 数据 预 取 
没有 哪个 数据 局 部 性 优化 方法 可 以 消除 所 有 的 内 存 访 问 。 首 先 , 第 一 次 使 用 的 数据 必须 从 
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内 存 中 获取 。 为 了 隐藏 内 存 访 问 的 延 时 ， 预 取 指 令 (prefetceh instruction) 被 很 多 高 性 能 处 理 器 采 
用 。 数 据 预 取 指令 被 用 来 向 处 理 器 指明 某 些 数据 有 可 能 很 快 就 会 被 用 到 , 因此 如 果 它 现在 还 没 
有 在 高 速 缓存 中 , 期 望 能 把 它 加 载 到 高 速 缓存 中 。 

11.5 节 中 描述 的 复 用 分 析 可 以 用 于 估计 什么 时 候 可 能 发 生 高 速 缓存 脱 靶 。 当 生成 预 取 指 
令 时 ， 有 两 个 重要 问题 需要 考虑 。 如 果 将 要 访问 连续 的 内 存 位 置 , 我 们 只 需要 为 每 个 高 速 组 
存 线 发 出 -- 个 预 取 指 令 。 我 们 必须 足够 早 地 发 出 预 取 指令 ,以 保证 在 使 用 这 个 数据 时 ， 它 已 
经 在 高 速 缓 在 中 了 。 但 是 , 我 们 不 应 该 过 早 地 发 出 预 取 指令 。 预 取 指令 可 能 会 把 高 速 缓存 中 
还 需要 使 用 的 数据 转移 出 高 速 缓存 ,而 预 取 到 的 数据 也 可 能 会 因此 在 使 用 之 前 就 被 调 出 高 速 
缓存 了 。 

Gi 11. 73 考虑 下 面 的 代码 : 


for (i=0; ii<3; i++) 
for (j=0; j<100; j++) 








for (i=0; ii<3; itt) { 





Ali, j] = ocs | for (j=0; j<6; j+=2) 
假设 目标 机 器 有 一 个 预 取 指令 。 该 指令 可 以 一 次 预 取 两 个 字 ME 
的 数据 ， 而 一 个 预 取 指令 的 延 时 大 约 等 于 上 面 的 循环 中 六 次 prefetch (#ALi, j+6]); 
和 迭代 的 执行 时 间 。 图 11-68 中 显示 了 这 个 例子 的 使 用 预 取 指 人 


令 的 代码 。 
我 们 把 最 内 层 的 循环 展开 两 次 ,使 得 可 以 为 每 个 高 速 组 A o e 

存 线 发 出 一 个 预 取 指 令 。 我 们 使 用 软件 流水 线 化 概念 来 保证 | } 

在 数据 被 使 用 的 六 个 送 代 之 前 预 取 数 据 。 流 水 线 的 前 言 部 分 ai 

获取 了 前 6 个 迭代 中 使 用 的 数据 , 稳定 状态 循环 在 它 进 行 计 图 11-68 为 预 取 数据 而 修改 的 代码 

算 的 同时 提前 预 取 6 个 迭代 。 尾 声 部 分 没有 预 取 指 令 ， 只 是 直接 执行 余下 的 迭代 。 m 


11.12 #11884 


o 数组 的 并 行 性 和 局 部 性 。 对 于 并 行 性 和 基于 局 部 性 的 优化 而 言 ， 最 重要 的 机 会 来 自 于 访 
问 数组 的 循环 。 在 这 些 循环 中 , 对 数组 元 素 的 各 个 访问 之 间 的 依赖 关系 通常 是 有 限 的 ， 
并 且 通 常 按照 一 个 正则 的 模式 访问 数组 元 素 。 这 些 因素 使 程序 可 以 获得 很 好 的 数据 局 部 
性 , 高 效 使 用 缓存 。 

© 仿 射 访问 。 几 乎 所 有 的 并 行 化 及 数据 局 部 性 优化 的 理论 和 技术 都 假设 对 数组 的 访问 是 仿 
射 的 : 这 些 数 组 下 标的 表达 式 是 循环 下 标的 线性 函数 。 

。 和 迭代 空间 : 一 个 具有 d 个 循环 的 循环 入 套 结构 定义 了 一 个 4 维 的 迭代 空间 。 该 空间 中 的 
点 都 是 值 的 4 元 组 , 元 组 中 的 值 对 应 于 该 租 套 循环 结构 运行 时 各 个 循环 下 标的 取 值 。 在 
仿 射 情况 下 , 各 个 循环 下 标的 界限 是 较 外 层 循环 下 标的 线性 函数 ,因此 迭代 空间 是 一 个 
多 面体 。 

© Fourier-Motzkin 消除 算法 。 对 迁 代 空间 的 关键 操作 之 一 是 把 定义 该 空间 的 各 个 循环 重新 排 
列 。 这 么 做 要 求 把 一 个 多 面体 迭代 空间 投影 到 它 的 部 分 维度 上 。Fourier-Motzkin 算法 把 
一 个 给 定 变 量 的 上 下 界 蔡 换 成 为 关于 这 些 界 限 的 不 等 式 。 

e 数据 依赖 与 数组 访问 。 在 为 了 并 行 性 和 局 部 性 优化 的 目的 而 处 理 循环 时 , 我 们 需要 解决 
的 一 个 中 心 问题 是 确定 两 个 数组 访问 之 间 是 否 具有 数据 依赖 关系 (也 就 是 它们 是 否 可 能 
触及 同一 个 数组 元 素 ) 。 如 果 这 些 访问 以 及 循环 界限 都 是 仿 射 的 , 迭代 空间 就 可 以 被 定义 
为 一 个 多 面体 。 而 上 面 的 问题 可 以 被 表示 为 一 个 特定 的 矩阵 - 向 量 方程 是 否 具 有 位 于 该 
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多 面体 中 的 解 。 

o 给 阵 的 秩 和 数据 复 用 。 用 来 描述 一 个 数组 访问 的 矩阵 可 以 给 出 多 个 关于 该 数组 访问 的 
重要 信息 。 如 果 该 矩阵 的 秩 达到 最 大 值 ( 即 和 矩阵 的 行 数 和 列 数 的 最 小 值 ) , 那么 当 这 个 
循环 迭代 运行 时 , 数据 访问 不 会 两 次 触及 同一 个 元 素 。 如 果 数 组 是 按 行 ( 列 ) 存 放 的 ， 
那么 删除 掉 最 后 (最 前 ) 一 行 后 得 到 的 矩阵 的 秩 可 以 告诉 我 们 这 个 访问 是 否 具 有 良好 的 
局 部 性 ， 即 单个 高 速 缓 存 线 中 的 元 素 被 几乎 同时 访问 。 

© 数据 依赖 关系 和 丢 番 图 方程 。 如 果 我 们 仅仅 知道 对 同一 数组 的 两 个 访问 触及 该 数组 的 同 
一 区 域 , 我 们 并 不 能 判定 它们 是 否 真 的 访问 了 某 个 公共 元 素 。 原 因 是 每 个 访问 都 可 能 跳 
过 某 些 元 素 。 比 如 , 一 个 访问 读 写 偶数 号 元 素 , 另 一 个 访问 读 写 奇 数 号 元 素 。 为 了 确定 是 
否 存在 数据 依赖 关系 ,我们 必须 求 一 个 丢 番 图 方程 (只 要 整数 解 ) 的 解 。 

o 解 丢 番 图 线性 方程 。 关 键 技 术 是 计算 各 个 变量 的 系数 的 最 大 公约 数 (GCD)。 只 有 当 这 个 
最 大 公约 数 能 够 整除 常量 项 时 , 方程 才 可 能 存在 整数 解 。 

e 空间 分 划 约 束 。 为 了 并 行 化 一 个 循环 嵌 套 结构 的 执行 过 程 , 我 们 需要 把 这 个 循环 的 迭代 
映射 到 一 个 处 理 器 空间 。 这 个 处 理 器 空间 可 能 具有 一 个 或 多 个 维度 。 空 间 分 划 约 柬 是 说 
如 果 不 同 选 代 中 的 两 个 访问 之 间 具有 数据 依赖 关系 ( 即 它们 访问 了 同一 个 数据 元 素 ), 那 
么 它们 必须 被 映射 到 同一 个 处 理 器 上 。 只 要 这 个 从 和 迭代 到 处 理 咒 的 映射 是 仿 射 的 , 我 们 
就 可 以 把 这 个 问题 用 矩阵- 向量 的 方式 表示 出 来 。 

e 基本 代码 转换 。 用 来 并 行 化 具有 仿 射 数组 访问 的 程序 的 转换 是 七 个 基本 转换 的 组 合 , EC 
们 是 : 循环 融合 、 循 环 裂变 、 重 新 索引 (给 循环 下 标 加 上 一 个 常量 ) 、 比 例 变换 (将 循环 下 
标 乘 以 一 个 常量 )、 反 置 (倒转 一 个 循环 的 下 标 )、 交 换 ( 交换 循环 的 顺序 ) 和 倾斜 (改写 循 
环 使 得 迭代 空间 中 的 扫描 线 不 再 和 某 个 坐标 轴 同 向 ) 。 

e 并 行 运算 的 同步 。 有 时 ,如 果 我 们 在 一 个 程序 的 步骤 之 间 插 入 同步 运算 , 就 可 以 获得 更 
多 的 并 行 性 。 比 如 , 相 邻 的 两 个 循环 授 套 结构 之 间 可 能 具有 数据 依赖 关系 , 但 是 在 这 两 
个 循环 之 间 的 同步 运算 可 以 使 得 各 个 循环 被 单独 并 行 化 。 

© 流水 线 化 。 这 个 并 行 化 技术 允许 处 理 器 共享 数据 , 方法 是 把 某 些 数据 (通常 是 数组 元 素 ) 
从 一 个 处 理 器 同步 传递 到 处 理 器 空间 中 的 相 邻 的 处 理 器 。 这 个 方法 可 以 提高 每 个 处 理 器 
所 访问 数据 的 局 部 性 。 

e 时 间 分 划 约 束 。 为 了 找到 流水 线 化 的 机 会 , 我 们 要 求 出 时 间 分 划 约 束 的 解 。 这 些 约束 是 
说 只 要 两 个 数组 访问 会 触及 同一 个 数组 元 素 , 那么 在 此 流水 线 中 , 首先 发 生 的 迭代 中 的 
访问 所 分 配 到 的 流水 线 阶段 不 得 晚 于 第 二 个 访问 所 分 配 的 流水 线 阶 段 。 

o 求解 时 间 分 划 约 束 。Farkas 引 理 提供 了 一 个 有 力 的 求解 技术 。 它 可 以 找 出 一 个 带 有 数组 
访问 的 给 定 循环 租 套 结构 所 允许 的 所 有 仿 射 时 间 分 划 映 射 。 这 个 技术 实质 上 是 把 原来 的 
表达 时 间 分 划 约 束 的 线性 不 等 式 公式 替换 成 为 它 的 对 偶 系统 。 

© 分 块 。 这 个 技术 把 一 个 循环 拒 套 结构 中 的 每 个 循环 都 分 割 成 为 两 个 循环 。 这 个 技术 的 优 
- 点 在 于 可 以 使 得 我 们 在 一 个 多 维 数组 的 小 段 ( 块 ) 上 进行 计算 , 每 次 处 理 一 个 块 。 这 么 做 
提高 了 程序 的 局 部 性 , 使 处 理 单个 块 时 需要 的 数据 都 在 高 速 缓存 中 。 

o 条 状 挖掘 。 和 分 块 技术 类 似 , 这 个 技术 只 把 一 个 循环 散 套 结构 中 的 一 部 分 循环 分 解 开 ， 
每 个 循环 分 成 两 个 循环 。 这 么 做 的 好 处 是 一 个 多 维 数组 被 一 条 一 条 地 访问 ,从 而 得 到 最 
好 的 高 速 缓存 利用 率 。 
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第 12 章 过程 间 分 析 


在 这 一 章 中 , 我 们 讨论 一 些 不 能 使 用 过 程 内 分 析 技 术 解决 的 优化 问题 , 由 此 引出 了 过 程 间 分 
析 的 重要 性 。 我 们 将 首先 描述 过 程 间 分 析 的 常见 形式 , 并 解释 实现 它们 的 难点 。 然 后 将 描述 过 
程 间 分 析 的 应 用 。 对 于 诸如 C 和 Java 这 样 广泛 使 用 的 程序 设计 语言 , 指针 别名 分 析 是 所 有 过 程 
间 分 析 技 术 的 关键 之 处 。 因 此 本 章 将 用 大 量 篇 幅 讨 论 获取 程序 中 的 指针 别名 信息 所 需要 的 技术 。 
我 们 先 给 出 Datalog 的 描述 , 这 种 表示 方法 极 大 地 隐藏 了 一 个 高 效 指针 分 析 技 术 的 复杂 性 。 然 后 
我 们 描述 一 个 用 于 指针 别名 分 析 的 算法 , 并 说 明 如 何 使 用 二 分 决策 图 ( Binary Decision Diagram, 
BDD ) 来 高 效 地 实现 这 个 算法 。 

大 部 分 编译 器 优化 技术 , 包括 那些 在 第 9、10、11 章 中 描述 的 技术 , 都 是 每 次 在 一 个 过 程 中 
执行 的 。 我 们 把 这 样 的 分 析 称 为 过 程 内 分 析 。 这 些 分 析 保 守 地 假设 被 调用 的 过 程 有 可 能 改变 过 
程 可 见 的 所 有 变量 的 状态 , 并 且 它 们 还 可 能 产生 某 种 副作用 ， 比 如 改变 此 过 程 可 见 的 任何 变量 的 
fA, 或 产生 导致 调用 栈 释 放 的 异常 。 因 此 , 过 程 内 分 析 虽 然 不 精确 , 但 是 却 相 对 简单 。 有 些 优 化 
不 需要 过 程 间 分 析 , 而 有 些 优化 不 借助 过 程 间 分 析 几 乎 不 会 产生 有 用 的 信息 。 

一 个 过 程 间 分 析 处 理 的 是 整个 程序 , 它 将 信息 从 调用 者 传送 到 被 调用 者 , 或 者 反 向 传送 。 一 - 
个 相对 简单 但 有 用 的 技术 是 过 程 内 联 (inline), 就 是 把 一 个 过 程 调用 蔡 换 为 被 调用 过 程 的 过 程 体 。 
在 替换 时 需要 考虑 参数 传递 和 返回 值 ， 因此 需要 进行 适当 修改 。 只 有 当 我 们 知道 这 个 过 程 调用 
的 目标 后 才 可 以 应 用 这 个 方法 。 

如 果 过 程 是 通过 一 个 指针 或 面向 对 象 编 程 中 常见 的 过 程 分 发 机 制 间接 调用 的 , 那么 对 程序 
指针 或 引用 的 分 析 有 时 可 以 确定 这 个 间接 调用 的 目标 。 如 果 目 标 是 唯一 的 , 那么 就 可 以 应 用 过 
程 内 联 方法 。 

即使 确定 了 每 个 过 程 调用 只 有 一 个 调用 目标 , 仍然 必须 谨慎 使 用 内 联 转换 。 一 般 来 说 , 不 可 
能 直接 内 联 递 归 的 过 程 , 并且 即 使 没有 递归 , 内 联 转 换 也 可 能 指数 级 地 增加 代码 的 大 小 。 


12.1 基本 概念 


在 本 节 中 , 我 们 将 介绍 调用 图 , 就 是 告诉 我 们 哪个 过 程 调用 了 哪个 过 程 的 图 。 我 们 也 会 介绍 
“上 下 文 相关 ”的 思想 , 即 进 行 数据 流 分 析 时 需要 认识 到 过 程 调用 的 序列 是 什么 。 也 就 是 说 ， 当 
上 下 文 相 关 分 析 在 区 分 程序 中 的 不 同 “ 位 置 ”" 时 , 它 不 仅 考 虑 当前 的 程序 点 , 还 考虑 当前 栈 中 的 
活动 记录 的 序列 (或 其 大 纲 )。 
12. 1.1 调用 图 

一 个 程序 的 调用 图 (call graph) 是 一 个 结 点 和 边 的 集合 , 并 满足 

1) 对 程序 中 的 每 个 过 程 都 有 一 个 结 点 。 

2) 对 于 每 个 调用 点 (call site) 都 有 一 个 结 点 。 所 谓 调 用 点 就 是 程序 中 调用 某 个 过 程 的 一 个 
位 置 。 

3) 如 果 调 用 点 c 调用 了 过 程 p, 就 存在 一 条 从 < 的 结 点 到 p 的 结 点 的 边 。 

很 多 用 诸如 C BY Fortran 语言 编写 的 程序 直接 进行 过 程 调用 , 因此 每 个 调用 的 调用 目标 可 以 
静态 地 确定 。 在 这 种 情况 下 ,调用 图 中 的 每 个 调用 点 都 恰好 有 一 条 边 指向 一 个 过 程 。 但 是 ,如 果 
程序 使 用 了 过 程 参数 或 函数 指针 , 一 般 来 说 , 需要 到 程序 运行 时 刻 才能 知道 调用 目标 ,而 且 实际 
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上 可 能 各 次 调用 的 目标 都 有 所 不 同 。 那 么 ,一 个 调用 点 可 能 连接 到 调用 图 中 的 多 个 甚至 所 有 的 
对 于 面向 对 象 程序 设计 语言 来 说 , 间接 调用 是 标准 的 调用 方式 。 特 别 地 ， 当 存在 子 类 对 方法 
进行 重 载 的 情况 时 , 对 方法 m 的 使 用 可 能 指向 多 个 不 同方 法 中 的 任意 一 个 , 这 要 取决 于 该 调用 所 
作用 的 接收 对 象 的 子 类 。 使 用 这 样 的 虚 (virtual ) 方 法 调用 意味 着 我 们 需要 知道 接收 者 的 类 型 之 后 
APA aT 个 方法 。 














ieee 图 12-1 显示 了 一 个 CC 程序。 该 程序 声明 pt 是 act ere 
一 个 指向 类 型 为 整数 到 整数 ”的 函数 的 全 局 指针 。 有 两 个 

函数 funl 和 fun2 是 这 个 类 型 。 此 外 ,main 函数 不 是 Ge 

pf 所 指向 的 类 型 。 图 中 显示 了 三 个 调用 点 , 标记 为 cl 、| ot a a: 

c2 Alc3, 这 些 标号 不 是 程序 的 一 部 分 。 return x; 
最 简单 的 对 pf 可 能 指向 哪个 函数 的 分 析 只 查看 函数 

的 类 型 。 函 数 funl 及 fun2 和 pf 所 指向 的 对 象 具 有 相同 int fun2(int y) { 

的 类 型 , 而 main 则 不 同 。 因此, 一 个 保守 的 调用 图 如 图 |, tea Ge 

12-2a 所 示 。 对 这 个 程序 进行 更 深入 的 分 析 , 就 可 以 观察 到 } 

pf Æ main 中 指向 fun2, 而 在 fun2 中 指向 funl, (Ae yoi ma 

没有 其 他 的 对 任何 指针 的 赋值 , 因此 pf 不 可 能 指向 main | pf = bfun2; 

函数 。 这 个 推理 过 程 产生 的 调用 图 和 图 12-2a 中 的 相同 。 | PPO 








一 个 更 加 精确 的 分 析 将 指出 pf 在 c3 上 只 可 能 指向 
fun2, 因为 紧 靠 这 个 调用 之 前 的 赋值 语句 将 fun2 赋 给 。” 图 12-1 一 个 具有 函数 沸 针 的 程序 
pf, XPE, pf 在 c2 处 只 可 能 指向 fun1。 分 析 的 结果 是 ， 对 funl 的 第 一 次 调用 必然 是 
fun2 做 出 的 , 且 funl 不 会 改变 pf 的 值 , 因此 
当 我 们 在 funl 中 时 , pf 就 指向 funl 。 特 别 地 ， si ( tun) 
我 们 可 以 确信 pf 在 cl 处 指向 funi, At, A 
12-2b 是 一 个 更 加 精确 、 正 确 的 调用 图 。 口 

一 般 来 说 ， 当 出 现 了 对 函数 或 方法 的 引用 或 
指针 时 , 要 求 我 们 对 所 有 过 程 参 数 、 指 针 、 接收 对 
象 类 型 等 的 可 能 取 值 进行 静态 估计 。 要 得 到 一 个 
精确 的 估计 和 值 就 必须 进行 过 程 间 分 析 。 这 个 分 析 
从 可 以 静态 观察 到 的 目标 开始 , 迭代 地 进行 。 当 
发 现 一 个 新 的 调用 目标 时 ， 分 析 过 程 就 会 把 一 条 
新 边 加 入 到 调用 图 中 ,并 不 断 寻 找 更 多 的 目标 ， 
直到 收敛 。 

12.1.2 上下文 相关 

过 程 间 分 析 很 具有 挑战 性 ,因为 各 个 过 程 的 行为 和 它 被 调用 时 所 在 的 上 下 文 相关 。 例 12.2 
通过 一 个 小 程序 上 的 过 程 间 常量 传播 问题 说 明了 上 下 文 的 重要 性 。 
考虑 图 12.3 中 的 程序 片段 。 函 数 / 在 三 个 调用 点 cl, c2 和 c3 上 被 调用 。 在 循环 的 
BURP, 常量 0 在 cl 上 被 作为 实在 参数 传递 , 而 常量 243 在 c2 和 c3 上 被 传递 , 这 些 调用 
分 别 返 回 常 量 1 和 244, Alb, 在 各 个 上 下 文中 函数 f 的 实在 参数 都 是 常量 , 但 是 常量 的 具体 值 
要 根据 上 下 文 而 定 。 














图 12-2 JAW 12-1 得 到 的 调用 图 
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如 我 们 将 看 到 的 ,除非 我 们 能 够 知道 在 上 下 文 cl 中 调 


for (i = 0; i < ni i++) { 


用 j 时 返回 1， 且 在 其 他 两 个 上 下 文中 调用 /时 返回 244, 否 | ei: ti = £(0); 
则 不 可 能 指出 t1 、t2 和 t3 都 被 赋予 了 一 个 常量 值 (因此 | 2: fete, 
X[ 站 也 被 赋予 了 常量 值 ) 。 通 过 一 个 简单 的 分 析 就 可 以 知道 KC) = tlrt2rt3i 
对 /的 各 次 调用 的 返回 值 可 能 是 1 或 244。 口 ; 

一 种 非常 简单 但 是 极端 不 精确 的 过 程 间 分 析 方法 称 为 int £ Gat v) { 


return (v+1); 





EF X HK AH (context-insensitive analysis) 。 它 把 每 个 调用 } 
和 返回 语句 看 作 一 个 “goto" 操 作 。 我 们 创建 一 个 超级 控制 流 
图 。 图 中 除了 一 般 的 过 程 内 控制 流 边 外 还 有 一 些 附 加 的 边 。 图 123 用 来 说 明 上 下 文 相关 分 析 
这 些 边 包括 的 需求 的 一 个 程序 片断 

| 1) 从 每 个 调用 点 到 它 所 调用 的 过 程 的 开始 处 的 边 。 

2) 从 返回 语句 回 到 调用 点 的 边 9 。 

另外 还 增加 了 一 些 赋 值 语句 , 它们 把 实在 参数 赋 给 相应 的 形式 参数 ,并 把 返回 值 赋 给 接收 返 
回 结果 的 变量 。 然 后 , 我 们 就 可 以 对 这 个 超级 控制 流 图 应 用 那些 为 分 析 单个 过 程 而 设计 的 标准 
分 析 技 术 ， 找 出 上 下 文 无 关 的 过 程 间 分 析 结果 。 这 个 模型 虽然 简单 , 但 它 抽象 掉 了 过 程 调 用 中 答 
入 值 和 输出 值 之 间 的 重要 关系 , 使 得 分 析 结 果 不 够 精确 。 
图 12-3 中 的 程序 的 超级 控制 流 图 显示 在 图 12-4 Po H B6 REKK HB 包含 了 
调用 点 cl, 它 把 形式 参数 "设置 为 0, 然后 跳 转 到 了 的 开始 处 。 类 似 地 ，54 和 B; 分 别 表示 调用 
点 c2 和 c3 Ba 可 以 从 所 基本 块 By) 的 结尾 处 到 达 。 我 们 在 By 中 把 /的 返回 值 赋 给 t1。 然 后 
把 形式 参数 , 设置 成 243 并 通过 跳 转 到 B6 再 次 调用 /。 请 注意 , 没有 从 B 到 达 B, 的 边 。 在 从 B 
ANA B, 的 路 上 , 控制 流 必须 穿越 f。 




















] 
t2 = retval 
四 ca:v=243 | 


theese f 


By 


图 12-4 图 12-3 的 控制 流 图 , 它 把 函数 调用 当 作 控 制 流 处 理 





O 实际 上 是 从 返回 语句 到 跟 在 调用 点 之 后 的 指令 的 边 。 
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B; 和 B, 类 似 。 它 接收 来 自 f 的 返回 值 并 把 返回 值 赋 给 t2 ,并 初始 化 对 了 的 第 三 次 调用 。 块 
B) 表示 了 第 三 次 调用 的 返回 和 对 [站 的 赋值 。 

如 果 我 们 把 图 12-4 当 作 单个 过 程 的 流 图 , 那么 可 以 断定 当 控 制 流 进入 B6 时 ,vv 的 值 可 以 是 0 
或 243。 因 此 , 我 们 最 多 能 够 断定 retval 的 值 是 1 或 244, 而 不 会 是 其 他 值 。 类 似 地 , 关于 tl, 
t2 和 t+3, 我 们 只 能 断定 它们 的 值 是 1 或 244。 因 此 , 看 起 来 X[ 引 的 值 为 3、246、489 或 732 之 
一 。 反 过 来 , 一 个 上 下 文 相关 分 析 可 以 区 分 每 次 调用 上 下 文 的 结果 ,并 产生 例 12. 2 中 描述 的 直 





觉 结 果 : tl 总 是 1, t2 和 t3 的 值 总 是 244, 而 X[ 让 的 值 为 489。 E] 
12.1.3 WAR 
在 例 12. 2 中 , 我 们 只 需要 知道 调用 过 程 / 的 调用 点 就 可 以 区 分 不 同 的 上 下 文 。 一 般 情况 下 ， 


一 个 调用 上 下 文 是 通过 整个 调用 栈 中 的 内 容 来 定义 的 。 我 们 把 栈 中 各 个 调用 点 组 成 的 串 称 为 调 
用 串 (call string) 。 
Coes 图 12-5 是 对 图 12-3 进行 细微 的 修改 后 得 到 的 。 这 里 我 们 把 对 /的 调用 替换 成 对 & 的 
HE. AAs 随后 用 同样 的 参数 调用 广 函数 & 调用 /的 地 点 是 cd , 这 是 一 个 新 增 的 调用 点 。 
有 三 个 对 应 于 /的 调用 串 : (cl, c4), (c2, c4) 和 (c3 ，c4) 。 如 我 们 在 这 个 例子 中 见 到 
的 ,函数 /中 的 值 并 不 由 调用 串 中 的 直接 (或 者 说 最 后 ) 调用 点 c4 决定 。 这 些 常量 值 实际 上 是 
由 每 个 调用 串 中 的 第 一 个 元 素 决定 的 。 口 
例 12.4 3289, 与 分 析 相 关 的 信息 可 能 在 调用 链 的 早期 就 被 引入 。 事 实 上 ,如 例 12.5 所 示 ， 
为 了 得 到 最 精确 的 答案 , 有 时 甚至 需要 考虑 计算 整个 调用 串 。 
可 加 这 个 例子 说 明了 对 不 限 长 度 的 调用 串 的 分 析 能 力 是 如 何 产生 出 更 加 精确 的 结果 的 。 
在 图 12-6 中 , 我 们 看 到 如 果 用 一 个 正 数值 来 调用 g, g 将 会 被 递归 地 调用 c 次 。 每 次 g 被 调用 
的 时 候 , 它 的 参数 bv 的 值 减 一 。 因 此 , 在 调用 串 为 c2(c4)" 的 上 下 文中 , g 的 参数 v 的 值 是 
243 -n, Alb, g 的 功能 就 是 把 0 或 任何 负 参 数 加 一 , 并 对 任何 大 于 等 于 1 的 参数 返回 2。 





























for (i = 0; i < n; i++) { 
cí: tl = g(0); 
c2: t2 = g(243); 
for (i = 0; i < n; i++) { c3: t3 = g(243); 
cl : tl = g(0); X[i] = ti+t2+t3; 
c2: t2 = g(243); } 
c3: t3 = g(243); 
X[i] = t1+t2+t3; int g (int v) { 
} if (v > 1) { 
c4: return g(v-1); 
int g (int v) { } else { 
c4: return f(v); cS: return f(v); 
} } 
int f (int v) { int f (int v) { 
return (v+1); return (v+1); 
} } 
图 12-5 ”演示 调用 串 的 程序 片段 图 12-6 需要 分 析 整 个 调用 串 的 递归 程序 


函数 /有 三 个 可 能 的 调用 串 。 如 果 我 们 从 cl 处 的 调用 开始 , 那么 g 可 以 立刻 调用 几 因此 (cl， 
c5 ) 就 是 这 样 的 一 个 串 。 如 果 我 们 从 c2 或 c3 开始 , 那么 我 们 共 调用 8 243 次 , 然后 再 调用 大 这 些 调 
用 串 是 (c2，c4，c4,，…， c5) 和 (c3，c4，c4，…， c5), 在 这 两 种 情况 下 的 序列 中 都 有 242 个 c4 。 在 
这 些 上 下 文中 , 在 第 一 个 上 下 文中 /的 参数 " 的 值 是 0,， 而 在 另外 两 个 中 的 参数 值 为 1。 a 
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在 设计 一 个 上 下 文 相 关 分 析 的 时 候 , 我 们 可 以 选择 不 同 的 精确 度 。 比 如 , 我 们 可 以 选择 只 使 
用 调用 串 中 最 直接 的 天 个 调用 点 来 区 分 上 下 文 ,而 不 是 使 用 整个 调用 # 来 提高 分 析 结 果 的 质量 。 
这 个 技术 被 称 为 大 界限 上 下 文 分 析 技 术 。 上 下 文 无 关 分 析 就 是 上 - 界限 上 下 文 分析 技 术 在 上 =0 
时 的 特例 。 我 们 可 以 使 用 1- 界限 分 析 技 术 找 出 例 12. 2 中 的 所 有 常量 , 用 2- 界 限 分 析 技术 找 出 例 
12.4 中 的 所 有 常量 。 但 是 ,只 要 例 12.5 中 HE 243 被 蔡 换 成 为 不 同 的 任意 大 小 的 常量 值 ， 没 
有 任何 态 界 限 分 析 可 以 找 出 该 例 中 的 所 有 党 

如 果 不 选 定 一 个 固定 的 大 值 ， es E ET E 
Ho SUBIC BREA ALS RIII OA EB. RTIA RAAB, 我 们 可 以 把 所 
有 的 递归 环 都 塌 缩 成 一 个 点 , 以便 限 定 需要 分 析 的 不 同上 下 文 的 数目 。 在 例 12.5 中 ,从 调用 点 
c2 开始 的 调用 可 以 用 调用 串 (c2 ，c4 * ,c5 ) 近似 地 表示 。 请 注意 , 使 用 这 种 方案 时 ， 即 使 对 于 
不 带 递 归 的 程序 , 不 同调 用 上 下 文 的 数目 和 程序 中 的 过 程 数目 呈 指 数 关系 。 
12.1.4 基于 克隆 的 上 下 文 相 关 分 析 

上 下 文 相 关 分 析 的 另 一 个 方法 是 在 概念 上 克隆 被 调用 过 程 , 对 于 每 个 感 兴 趣 的 上 下 文 都 进 
行 -一 次 克隆 。 然 后 我 们 就 可 以 对 克隆 过 的 调用 图 应 用 上 下 文 无 关 分 析 。 例 12.6 和 12.7 分 别 给 
出 了 和 例 12. 4 和 12.5 等 价 的 克隆 版 本 。 在 实际 分 析 时 , 我 们 不 需要 真 的 克隆 代码 ,而 是 可 以 直 
和 代用 二 个 高 效 的 内 部 表示 来 跟踪 各 个 克隆 部 分 的 分 析 结 果 
12. 图 12-5 的 克隆 版 本 显示 在 图 12-7 中 。 a en 因此 不 


存在 混 清 的 情况 。 比 如 , g1 的 输入 为 0, 产生 输出 1; 92 和 g3 接受 输入 243 并 产生 输出 244。 口 




















for (i = 0; i <n; i++) { 


el: ti = g1(0); 
c2: t2 = g2(243); 
c3: t3 = g3(243); 


X[i] = t1+t2+t3; 
J 
int gl (int v) { 
c4.4: return fi1(v); 
} 
int g2 (int v) { 
c4.2: return f2(v); 
} 
int g3 (int v) { 
c4.3: return f£3(v); 


} 


int f1 (int v) { 
return (v+1); 

} 

int £2 (int v) { 
return (v+1); 

} 

int £3 (int v) { 
return (v+1); 

+ 


图 12-7 图 12-5 的 克隆 版 本 


i d 012.5 的 克隆 版 本 显示 在 图 12-8 中 。 我 们 创建 了 过 程 g 的 一 个 克隆 版 本 , 它 代表 所 
有 首先 在 cl, c2 和 c3 处 调用 的 g 的 实例 。 在 这 种 情况 下 ， 如 果 一 个 分 析 技 术 能 够 从 v=0 推导 
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出 vz>1 不成立, 那么 该 分 析 将 会 确定 在 调用 点 ci 处 的 调用 将 会 返回 1。 但 是 ,这 个 分 析 不 能 很 





好 地 处 理 递 归 , 不 能 分 析 得 到 调用 点 c2 和 c3 处 的 常量 值 。 口 
for (i = 0; i < n; i++) { 
ciz ti = g1(0); 
c2: t2 = g2(243); 
c3: t3 = g3(243); 
X[i] = ti+t2+t3; 
} 
int g1 (int v) { 
if (v > 1) { 
c4.4: return gi(v-1); 
} else { 
c5.1: return f1(v);} 


} 


int g2 (int v) { 
if (v > 1) { 


c4.2: return g2(v-1); 
} else { 
c5.2: return f2(v);} 
} 
int g3 (int v) { 
if (v> 1) { 
c4.3: return g3(v-1); 
} else { 
c5.3: return £3(v);} 
} 


int fi (int v) { 
return (v+1); 

} 

int f2 (int v) { 
return (v+1); 

} 

int f3 (int v) { 
return (v+1); 


} 











图 12-8 图 12-6 的 克隆 版 本 


12.1.5 基于 摘要 的 上 下 文 相关 分 析 

基于 摘要 的 过 程 间 分 析 是 基于 区 域 的 分 析 技 术 的 扩展 。 基 本 上 , 在 一 个 基于 摘要 的 分 析 中 ， 
每 个 过 程 使 用 一 个 简洁 的 描述 (摘要 ) 来 刻 划 。 这 个 描述 包含 这 个 过 程 的 某 些 可 观察 行为 。 摘 要 
的 主要 目的 是 避免 在 每 个 可 能 调用 某 过 程 的 调用 点 上 都 重复 分 析 该 过 程 的 过 程 体 。 

证 我 们 首先 考虑 没有 递归 的 情况 。 每 个 过 程 被 建 模 为 只 有 一 个 人 口 点 的 区 域 。 每 一 对 调用 
者 -被 调用 者 之 间 具 有 类 似 于 外 层 区 域 - 内 层 区 域 的 关系 。 和 过 程 内 分 析 的 唯一 不 同 在 于 , 在 
过 程 间 分 析 时 , 一 个 过 程 区 域 可 能 艇 套 在 多 个 不 同 的 外 层 区 域 中 。 

这 个 分 析 由 两 部 分 组 成 : 

1) 一 个 自 底 向 上 的 阶段 , 它 为 每 个 过 程 计算 出 一 个 总 结 该 过 程 的 效果 的 传递 函数 。 

2) 一 个 自 顶 向 下 的 阶段 , 它 传 播 和 调用 者 有 关 的 信息 , 计算 出 被 调用 者 的 结果 。 

为 了 得 到 完全 上 下 文 相关 的 结果 , 来 自 不 同调 用 上 下 文 的 信息 必须 被 单独 传递 到 被 调用 者 。 
如 果 希 望 计 算 过 程 更 高 效 , 但 是 允许 相对 的 不 精确 性 , 那么 也 可 以 使 用 一 个 交 函 数 合并 来 自 各 个 
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是 如 何 通过 它 的 过 程 体 传播 常量 的 。 在 例子 12. 2 中 , 我 们 可 以 把 了 总 结 为 如 下 的 函数 : 如 果 把 -一 


个 常量 作为 "的 实在 参数 , 那么 该 注 数 返回 常量 c+1。 基 于 这 个 信息 ， 


这 个 分 析 过 程 将 确定 


tl, t2 和 ft3 分 别 具 有 常量 值 1、244 和 244。 请 注意 , 这 个 分 析 过 程 并 没有 内 为 不 可 实现 的 调用 


串 而 产生 不 精确 的 结果 。 


回忆 一 下 , 例子 12.4 扩展 了 例子 12.2, 增加 了 一 个 函数 & 来 调用 f。 因 此 我 们 可 以 得 出 结论 , g 的 
传递 函数 和 /的 传递 函数 是 相同 的 。 我 们 仍然 可 以 确定 t1、t2 和 上 3 分 别 具 有 常量 值 1、244 和 244。 


现在 让 我 们 考虑 例子 12. 2 中 函数 了 内 的 参数 * 的 值 是 什 
么 。 最 初 考虑 时 ,我 们 可 以 把 所 有 调用 上 下 文 的 结果 组 合 在 


一 起 。 央 为 vz 的 值 可 以 是 0 或 者 243, 所 以 可 以 简单 地 确定 ， 
不 是 一 个 常量 。 这 个 结论 是 合理 的 ,因为 没有 哪个 常量 可 以 
替换 代码 中 的 vo 


如 果 我 们 希望 得 到 更 加 精确 的 结果 , 那么 可 以 为 感 兴 趣 
的 上 下 文 计算 特定 值 。 必 须 把 信息 从 我 们 感 兴趣 的 上 下 文 
向 下 传递 ,以 确定 和 这 个 上 下 文 相关 的 答案 。 这 个 步骤 和 基 
于 区 域 的 分 析 中 的 自 顶 向 下 过 程 类 似 。 比 如 , "在 调用 点 cl 
处 的 值 为 0, 而 它 在 调用 点 c2 和 c3 处 的 值 为 243。 为 了 利 
用 /内 部 的 常量 传播 性 质 , 我 们 需要 创建 两 个 克隆 来 表示 这 
两 者 的 不 同 , 第 一 个 克隆 是 针对 输入 值 0 的 特例 ,而 后 一 个 
克隆 是 针对 输入 值 243 的 特例 , 如 图 12-9 所 示 。 




















for (i = 0; i <n; i++) { 


ci: ti = £0(0); 
c2: t2 = £243(243); 
c3: t3 = £243(243); 


X[i] = ti+t2+t3; 
} 


int f0 (int v) { 
return (1); 


} 


int £243 (int v) { 
return (244); 
} 








图 12-9 将 所 有 可 能 的 常量 参数 
传递 给 函数 了 后 的 分 析 结果 


通过 例子 12.8, 最 后 我 们 看 到 如 果 希 望 在 不 同 的 上 下 文中 以 不 同 的 方式 编译 代码 , 仍然 需要 
克隆 代码 。 本 方法 和 基于 克隆 的 方法 的 不 同 之 处 在 于 后 者 在 分 析 之 前 就 需要 根据 调用 串 进行 克 


隆 。 在 基于 摘要 的 方法 中 , 克隆 是 在 分 析 之 后 ,以 分 析 结 
果 为 基础 进行 克隆 。 即 使 没有 进行 克隆 , 在 基于 摘要 的 方 
法 中 关于 一 个 被 调用 过 程 的 运行 效果 的 推理 结果 也 是 精确 
的 , 不 会 出 现 不 可 实现 路 径 的 问题 。 

除了 克隆 一 个 函数 , 我 们 也 可 以 对 代码 进行 内 联 处 理 。 
内 联 的 另 一 个 效果 是 消除 了 过 程 调用 的 开销 。 

我 们 可 以 用 计算 不 动 点 解 的 方法 来 处 理 递归 。 当 出 现 
递归 时 , 我 们 首先 找 出 调用 图 中 的 强 连 通 分 量 。 在 自 底 向 
上 阶段 ， 只 有 当 一 个 强 连 通 分 量 的 所 有 后 继 都 已 经 被 访问 
ZR, 我们 才 访 问 这 个 分 量 。 对 于 一 个 非 平凡 的 强 连通 分 
量 , 我 们 迭代 地 为 该 分 量 中 的 每 个 过 程 计算 传递 函数 ， 直 
到 重复 过 程 收 全 为 止 。 也 就 是 说 , 我 们 迭代 地 更 新 这 些 传 
递 冰 数 ， 直 到 它们 不 再 发 生 改 变 为 止 。 
12.1.6 12.1 节 的 练习 

练习 12. 1.1: 图 12-10 中 是 一 个 带 有 两 个 函数 指针 
Aq 的 C 程序 。N 是 常量 , 它 可 能 比 10 小 也 可 能 比 10 大。 
请 注意 ,这 个 程序 会 产生 无 穷 的 过 程 调 用 序列 , 但 是 这 和 








int (*p) (int); 
int (*q) Cint); 


int f(int i) { 


if Gi < 10) 

{p = &g; return (*q) (i) ;} 
else 

{p = &f; return (*p)(i);} 


} 


int g(int j) { 


if (j < 10) 

{q = &f; return (*p)(j);} 
else 

{q = kg; 


return (*q)(j);} 
} ; 


void main() { 
p = &f; 


q = &g; 
(xp) (Ca) (N)); 





图 12-10 练习 12.1.1 的 程序 
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我 们 当前 考虑 这 个 问题 的 目的 无 关 。 
1) 找 出 本 程序 中 的 所 有 调用 点 。 
2) 对 于 每 个 调用 点 , 刀 可 能 指向 哪些 亢 数 ? q 可 能 指向 哪些 函数 ? 
3) 通 出 这 个 程序 的 调用 图 。 
4) 描述 和 & 的 所 有 调用 串 。 
练习 12. 1.2: 图 12-11 中 有 一 个 函数 ia, 这 个 函数 
是 一 个 “单位 函数 "。 它 的 返回 值 就 是 传递 给 它 的 参数 
值 。 图 中 还 有 一 个 代码 片段 , 该 片段 包含 一 个 分 支 语 句 ， 





int id(int x) { return x;} 


P(e ed Cx wate ye ae F 








后 面 跟随 一 个 计算 * +y 的 和 的 赋值 语句 。 else { x = id(3); y = id(2); } 
1) 检查 这 个 代码 , 关于 z 在 结尾 处 的 值 , 我 们 可 以 acs 
有 哪些 结论 ? 


2) 把 对 id 的 调用 当 作 控制 流 处 理 , 为 这 个 代码 片 图 12-11 练习 12.1.2 的 代码 片断 
| RETA 

3) 如 果 我 们 对 问题 2 中 得 到 的 流 图 应 用 9.4 节 中 描述 的 常量 传播 分 析 , 可 以 确定 哪些 常 
ufa? 

4) 图 12-11 中 的 爹 部 调用 点 是 哪些 ? 

5) 共有 哪些 调用 了 id 的 上 下 文 ? 

6) 改写 图 12-11 中 的 代码 , 为 每 一 个 调用 id 的 上 下 文 克隆 一 个 函数 ia 的 新 版 本 。 

7) 把 对 ia 的 调用 作为 控制 流 处 理 , 构造 你 在 问题 6 中 得 到 的 代码 的 流 图 。 

8) 对 于 在 问题 7 中 得 到 的 流 图 进行 常量 传播 分 析 。 现 在 可 以 确定 哪些 常量 值 ? 


12.2 为 什么 需要 过 程 间 分 析 


我 们 已 经 说 明了 过 程 间 分 析 有 多 人 么 困难 , 现在 让 我 们 来 解决 一 个 重要 的 问题 ; 我 们 为 什么 以 
及 希望 在 什么 时 候 使 用 过 程 间 分 析 。 虽 然 我 们 使 用 常量 传播 的 例子 来 演示 过 程 间 分 析 , 但 这 个 
过 程 间 优 化 技术 并 不 是 容易 使 用 的 ,而 且 进行 这 个 分 析 也 没有 什么 特别 的 好 处 。 仅 仅 通过 过 程 
内 分 析 和 把 最 频繁 执行 的 代码 段 中 的 过 程 调 用 进行 内 联 处 理 ,， 就 可 以 获得 常量 传播 的 大 部 分 
好 处 。 

BÆ, 有 很 多 理由 可 以 说 明 为 什么 过 程 间 调用 是 非常 重要 的 。 下 面 我 们 描述 过 程 间 分 析 的 
几 个 重要 应 用 。 
12.2.1 虚 方法 调用 

上 面 提 到 过 , 面向 对 象 程序 有 很 多 小 的 方法 。 如 果 我 们 每 次 只 对 一 个 方法 进行 优化 , 那么 只 
能 找到 很 少 的 优化 机 会 。 对 方法 调用 进行 解析 就 可 以 促成 更 多 的 优化 。 像 Java 这 样 的 程序 设计 
语言 动态 地 载 人 它 的 类 。 结 果 , 我 们 在 编译 时 刻 不 知 道 在 x. m( ) 这 样 的 调用 中 对 m 的 某 次 使 用 
到 底 指向 (可 能 的 ) 多 个 名 为 m 的 方法 中 的 哪 一 个 。 

很 多 Java 语言 的 实现 使 用 了 一 个 即时 编译 器 ,在 运行 时 刻 对 它 的 字 节 码 进行 编译 。 一 个 常 
见 的 优化 技术 是 找 出 程序 执行 的 剖面 图 ,并 确定 接收 对 象 通常 是 什么 类 型 。 然 后 , 我 们 可 以 把 调 
用 最 频繁 的 方法 内 联 到 调用 代码 中 。 相 应 的 代码 包含 了 对 这 个 类 型 的 动态 检查 , 如 果 运 行 时 刻 
的 接收 对 象 具有 预期 的 类 型 就 执行 内 联 的 方法 。 

只 要 所 有 的 源 代 码 都 在 编译 时 刻 可 用 , 我 们 就 可 以 使 用 另 一 种 方法 来 解析 对 方法 名 字 m 的 
使 用 。 然 后 , 可 以 进行 过 程 间 分 析 , 确定 对 象 类 型 。 如 果 变 量 x 的 类 型 是 唯一 的 , ABA x. m( ) 的 
使 用 就 可 以 被 解析 。 我 们 明确 地 知道 在 这 个 上 下 文中 m 指向 哪个 方法 。 在 这 种 情况 下 , 我 们 可 


过 程 间 分 析 
以 内 联 这 个 m 的 代码 , 编译 器 其 至 不 需要 在 生成 的 代码 中 加 入 对 * 的 类 型 检查 代码。 
12.2.2 指针 别名 分 析 
即使 我 们 不 想 执行 诸如 到 达 定 值 这 样 的 常见 数据 流 分 析 的 过 程 间 分 析 版 本 , 这 些 分 析 实 际 
上 也 可 以 从 过 程 间 指 针 分 析 中 获 益 。 第 9 章 给 出 的 所 有 分 析 只 能 应 用 于 没有 别名 的 局 部 标量 变 
量 。 然 而 , 指针 的 使 用 是 很 常见 的 , 在 像 C 这 样 的 语言 中 尤其 如 此 。 如 果 知 道 多 个 指针 是 否 可 能 














x = *Pp; 
如 果 不 知道 p 和 4 是 否 可 能 指向 同一 个 位 置 ,也 就 是 说 ,它们 是 否 可 能 互 为 别名 , 那么 就 不 
能 确定 < 在 基本 块 的 结尾 处 等 于 1。 m 


12.2.3 并行 化 

如 第 11 章 中 所 讨论 的 , 将 一 个 应 用 并 行 化 的 最 有 效 方法 是 寻找 最 粗 粒 度 的 并 行 性 ,例如 在 
一 个 程序 的 最 外 层 循 环 中 找到 的 并 行 性 。 要 完成 这 个 任务 , 过 程 间 分 析 技 术 是 非常 重要 的 。 标 
量 优化 ( 即 基于 简单 变量 的 值 的 优化 , 比如 第 9 章 中 讨论 的 技术 ) 和 并 行 化 之 间 有 很 大 的 不 同 。 
在 并 行 化 中 , 一 个 可 疑 的 数据 依赖 关系 就 可 能 使 得 整个 循环 不 可 并 行 化 , 从 而 大 大 降低 优化 的 有 
效 性 。 这 种 对 不 精确 性 的 放大 在 标量 优化 中 是 看 不 到 的 。 在 标量 优化 中 , 我 们 只 需要 找 出 大 部 
分 优化 机 会 即 可 。 错 过 一 两 个 机 会 并 不 会 引起 很 大 的 不 同 。 
12.2.4 ”软件 错误 和 漏洞 的 检测 

过 程 间 分 析 不 仪 仅 对 优化 代码 很 重要 。 同 样 的 技术 也 可 以 用 于 分 析 已 有 软件 , 寻找 各 种 编 
码 错 误 。 这 些 错 误 可 能 会 使 得 软件 变 得 不 可 靠 , 黑客 可 以 利用 这 些 错 误 来 控制 或 毁坏 一 个 计算 
机 系统 。 计 算 机 系统 的 代码 错误 可 能 引起 严重 的 安全 漏洞 。 

静态 分 析 可 以 用 于 检测 是 否 存 在 常见 的 多 种 错误 模式 。 比 如 , 一 个 数据 项 必须 用 一 个 锁 来 
保护 。 另 一 个 例子 是 , 在 操作 系统 中 屏蔽 一 个 中 断后 必须 随后 重新 启用 这 个 中 断 。 这 类 错误 的 
一 个 重要 源头 是 跨越 过 程 边界 的 代码 之 间 的 不 一 致 性 , 因此 过 程 间 分 析 极 为 重要 。PREfix 和 
Metal 是 两 个 实用 的 工具 , 它们 有 效 地 使 用 过 程 间 分 析 技 术 在 大 型 程序 中 寻找 多 种 程序 错误 。 这 
类 工具 可 以 静态 地 找到 错误 ,从 而 大 大 提高 软件 可 靠 性 。 但 是 , 这 些 工具 既 不 完全 也 不 健全 。 从 
这 个 意义 上 说 , 它们 不 能 找到 所 有 的 错误 ,并 且 不 是 报告 的 所 有 警告 都 是 错误 。 遗 贼 的 是 ,它们 
使 用 的 过 程 间 分 析 技术 相当 地 不 精确 , 如 果 让 这 些 工 具 报 告 所 有 可 能 的 错误 , 大 量 的 假 报警 会 使 
得 工具 无 法 使 用 。 无 论 如 何 , 虽然 这 些 工 具 不 是 完美 的 , 但 它们 的 系统 化 使 用 已 经 表明 它们 能 够 
大 大 提高 软件 的 可 靠 性 。 

当 考 虑 安全 缺陷 时 , 我 们 非常 期 望 找到 一 个 程序 中 所 有 可 能 的 错误 。 在 2006 年 , 黑客 使 用 
的 两 个 “最 流行 "的 威胁 系统 完全 的 人 侵 形 式 是 : 

1) Web 应 用 中 输入 确认 机 制 的 缺失 : SQL 注入 是 这 种 攻击 最 流行 的 形式 之 一 。 黑 客 们 利用 
这 个 弱点 , 通过 操控 被 Web 应 用 接收 的 输入 来 获取 对 数据 库 的 控制 。 

2) C 和 CH 程序 中 的 缓冲 区 溢出 。 因 为 C 和 CH 不 对 数组 访问 进行 边界 检查 , 黑客 就 可 以 写 出 一 
个 精心 构造 的 字符 串 , 使 得 它 从 缓冲 区 中 延伸 到 未 预料 到 的 区 域 , 从 而 控制 这 个 程序 的 运行 。 

在 下 一 节 中 , 我 们 将 讨论 如 何 使 用 过 程 间 分 析 技 术 来 保护 程序 不 受 这 样 的 攻击 。 
12.2.5 SQL 注 入 

SQL 注入 是 一 种 黑客 攻击 方法 。 黑 客 可 以 通过 操纵 一 个 Web 应 用 的 用 户 输入 , 从 而 获得 对 
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数据 库 的 未 授权 访问 。 比 如 , 银行 可 能 希望 只 要 它 的 用 户 能 够 提供 正确 的 口令 , 他 就 可 以 在 线 完 
成 业务 处 理 。 这 类 系统 的 一 个 常用 体系 结构 是 让 用 户 在 一 个 Web 表单 中 输入 字符 串 , 然后 把 这 
些 字符 串 组 成 某 个 用 SQL 语言 编写 的 数据 库 查询 的 一 部 分 。 如 果 系 统 开发 者 不 小 心 , 用 户 提 供 
的 字符 串 可 能 以 不 可 预料 的 方式 改变 这 个 SQL 语句 的 含义 。 

AED 假设 一 个 银行 向 它 的 客户 提供 了 对 一 个 关系 

AcctData(name, password, balance) 

的 访问 。 也 就 是 说 , 这 个 关系 是 一 个 由 多 个 三 元 组 组 成 的 表 , 每 个 三 元 组 包含 一 个 客户 的 名 字 、 
账户 口令 和 该 账户 的 余额 。 系 统 的 本 意 是 使 得 客户 只 有 在 提供 了 他 们 的 名 字 和 正确 口令 之 后 才 





能 够 看 到 账户 余额 。 让 一 个 黑客 看 到 账户 余额 并 不 是 可 能 发 生 的 最 糟糕 的 事情 , 但 是 这 个 简单 
例子 是 更 复杂 情况 的 典型 代表 , 更 复杂 的 情况 是 黑客 可 以 使 用 那个 账户 付 账 。 | 
系统 可 以 按照 如 下 方式 实现 一 次 余额 查询 : 


1) 用 户 调 用 一 个 Web 表单 , 在 表单 中 输入 他 们 的 名 字 和 口令 。 
2) 名 字 被 拷贝 到 一 个 变量 ”， 口令 被 拷贝 到 男 一 个 变量 po 
3) 然后 ,可 能 在 某 些 其 他 过 程 中 , 执行 下 列 SQL 查询 : 


SELECT balance FROM AcctData 
WHERE name = ’:n’ and password = ’:p’ 


我 们 向 不 熟悉 SQL 的 读者 解释 一 下 这 个 查询 含义 。 该 语句 的 含义 是 :“ 在 表 AcctData PRR 
出 一 行 , 要 求 第 一 个 分 量 (名 字 ) 等 于 变量 n 中 的 当前 字符 串 , 而 第 二 个 分 量 (口令 ) 等 于 变量 p 
中 的 当前 字符 串 ; 然后 打印 这 一 行 的 第 三 个 分 量 (余额 )。” 请 注意 , 这 个 SQL 语句 使 用 了 单 引号 
而 不 是 双 引 号 来 分 割 符号 串 , n 和 p 之 前 的 冒号 表明 它们 是 外 围 语言 的 变量 。 

假设 一 个 黑客 想 找 到 Charles Dickens 的 账户 余额 ,他 向 n Mp 提供 了 下 面 的 值 ; 

n = Charles Dickens’ -- p= who cares 


这 个 奇怪 的 字符 串 的 作用 是 把 上 面 的 查询 转变 成 
SELECT balance FROM AcctData 
WHERE name = ’Charles Dickens’ --’ and password = ’who cares’ 


在 很 多 数据 库 系统 中 , -- 是 一 个 注释 引导 符号 , 其 作用 是 把 该 行 中 跟 在 其 后 的 所 有 内 容 看 作 
一 个 注释 。 结 果 , 现在 这 个 查询 语句 要 求 数据 库 系 统 打 印 出 每 个 名 字 为 'Charles Dickens ' 的 
个 人 的 账户 余额 , 而 不 考虑 在 name-password-balance 三 元 组 中 和 该 名 字 一 起 出 现 的 口令 。 也 就 是 
说 , 删除 注释 之 后 , 这 个 查询 变 成 了 : 口 


SELECT balance FROM AcctData 
WHERE name = ’Charles Dickens’ 


在 例子 12. 10 H, MOR SABRE TEP, 它们 可 能 在 过 程 之 间 传 递 。 但 是 , 在 更 加 
真实 的 情况 中 , 这 些 字符 串 可 能 被 多 次 复制 , 或 者 和 其 他 字符 串 组 成 完整 的 查询 语句 。 如 果 我 们 不 对 
整个 程序 进行 全 面 的 过 程 间 分 析 , 就 不 能 指望 能 够 检测 到 导致 SQL 注 人 攻击 的 代码 错误 。 

12. 2.6 缓冲 区 溢出 

当 一 个 由 用 户 提 供 的 精心 制作 的 数据 被 写 到 了 预想 的 缓冲 区 之 外 并 操纵 程序 的 执行 时 ， 就 
发 生 了 缓冲 区 溢出 攻击 (buffer overflow attack)。 比 如 , 一 个 C 程序 可 能 从 用 户 那里 读 取 一 个 字符 
串 s, 然后 使 用 函数 调用 

strcpy(b,s); 

把 它 拷贝 到 一 个 缓冲 区 中 。 如 果 字 符 串 ;实际 上 比 缓冲 区 5 长 , 那么 在 缓冲 区 5 之 外 的 某 些 内 
存 位 置 上 的 值 将 会 被 改变 。 这 个 情况 本 身 可 能 会 使 程序 产生 故障 , 或 者 至 少 产生 错误 的 管 案 , A 
为 程序 使 用 的 某 些 数据 可 能 已 经 被 改变 了 。 
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但 是 实际 情况 会 更 糟糕 选择 字符 串 * 的 黑客 可 以 选择 一 个 特别 的 值 ,使 得 它 的 作用 不 仅仅 
是 引起 一 个 错误 。 比 如 , 如 果 该 缓冲 区 位 于 一 个 运行 时 刻 栈 中 , 那么 它 可 能 离 存 放 该 函数 的 返回 
地 址 的 位 置 很 近 。-- 个 经 过 精心 选择 的 恶意 的 * 值 可 以 覆盖 掉 这 个 地 址 ， 当 函数 返回 时 ， 它 跳 转 
到 黑客 选择 的 地 方 。 如 果 黑 客 熟悉 操作 系统 和 硬件 ,那么 他 们 就 能 够 执行 一 个 命令 让 系统 赋予 
他 们 控制 这 台 计算 机 的 能 力 。 在 有 些 情况 下 , 他们 甚至 可 以 有 能 力 让 那个 假 的 返回 地 址 把 控制 
传递 到 作为 字符 串 * 的 一 部 分 的 代码 中 , 这 样 就 能 将 任何 种 类 的 程序 插入 到 正在 执行 的 代码 中 。 

为 了 防止 缓冲 区 滋 出 ,我 们 要 么 必须 通过 静态 的 方法 证 明 每 个 数组 写 运算 都 处 于 边界 之 内 ， 
要 么 必须 进行 适当 的 动态 数组 边界 检查 。 因 为 在 C 和 C++ 程序 中 必须 手工 插入 这 些 边 界 检查 ， 
程序 员 很 容易 忘记 插入 测试 代码 , 或 者 插入 错误 的 测试 代码 。 人 们 已 经 开发 了 启发 式 工具 来 检 
查 是 否 在 调用 -- 个 stropy 之 前 至 少 进行 了 某 些 测试 ,虽然 这 些 测试 不 一 定 是 正确 的 。 

动态 边界 检查 是 不 可 和 避免 的 ,因为 不 可 能 静态 地 确定 用 户 输入 的 大 小 。 静 态 分 析 可 以 做 的 
所 有 事情 就 是 保证 正确 地 插 人 了 动态 检查 代码 。 因 此 ,一 个 可 行 的 策略 是 让 编译 器 在 每 个 写 操 
作 上 插入 动态 边界 检查 , 并 以 静态 分 析 为 手段 尽 可 能 优化 掉 动 态 检 查 代码 。 这 样 就 不 再 需要 去 
捕捉 每 个 可 能 违背 边界 条 件 的 情况 。 而 且 , 我 们 只 需要 优化 那些 频繁 执行 的 代码 区 域 。 

即使 我 们 不 在 乎 运行 开销 , 在 C 程序 中 插入 边界 检查 也 不 是 容易 的 事情 。 一 个 指针 可 能 指 
向 某 个 数组 的 中 间 ， 而 且 我 们 还 不 知道 这 个 数组 的 大 小 。 可 以 使 用 已 有 的 技术 来 动态 跟踪 各 个 
指针 指向 的 缓冲 区 的 大 小 。 这 个 信息 允许 编译 器 为 所 有 的 访问 都 插入 数组 边界 测试 。 有 意思 的 
E, 我 们 并 不 建议 一 检测 到 缓冲 区 溢出 就 停止 执行 程序 。 实 际 上 ， 实践 中 确实 会 发 生 缓 冲 区 滋 
E, 如果 我 们 不 允许 所 有 的 缓冲 区 溢出 ， 一 个 程序 就 很 容易 出 错 。 解 决 的 方法 是 动态 扩展 缓冲 区 
的 大 小 以 应 对 缓冲 区 溢出 。 

可 以 利用 过 程 间 分 析 技 术 来 提高 动态 的 数组 边界 检查 的 速度 。 比 如 ,假设 我 们 只 关注 和 用 
户 输入 字符 串 有 关 的 缓冲 区 溢出 , 那么 可 以 使 用 静态 分 析 技术 来 决定 哪个 变量 可 能 存放 了 用 户 
提供 的 内 容 。 和 SQL 注入 一 样 , 如果 我 们 能 够 跟踪 一 个 输入 值 在 过 程 间 传递 复制 的 过 程 , 就 有 利 
于 消除 不 必要 的 边界 检查 。 


12.3 数据 流 的 一 种 逻辑 表示 方式 


可 以 说 , 到 现在 为 止 , 我 们 对 数据 流 问 题 和 解答 的 表示 方法 是 基于 集合 理论 的 。 也 就 是 说 ， 
我 们 把 信息 表示 成 集合 , 并 通过 交 、 并 这 样 的 运算 来 计算 结果 。 比 如 ， 当 我 们 在 9. 2. 4 节 中 介绍 
到 达 定 值 问 题 时 , 我 们 为 一 个 基本 块 计算 IN[B] 和 OUT[8], 并 把 它们 描述 为 定 值 的 集合 。 我 
们 用 基本 块 B 的 gen 和 kill 集合 来 表示 这 个 基本 块 的 内 容 。 

为 了 应 对 过 程 间 分 析 的 复杂 性 , 我 们 引入 一 个 更 加 通用 且 更 加 明确 的 基于 逻辑 的 表示 方法 。 
我 们 不 再说 诸如 “ 定 值 D 在 IN[8] 中 ”这 样 的 断言 , 而 是 使 用 类 似 于 in(8, DD) 这 样 的 表示 方法 来 
表示 同样 的 意思 。 这 人 么 做 使 我 们 把 那些 用 以 推断 程序 性 质 的 简明 的 “规则 ”表示 出 来 。 它 也 使 我 
们 能 高 效 地 实现 这 些 规 则 , 实现 方法 是 对 集合 运算 的 位 向 量 方法 进行 推广 。 最 后 , 逻辑 方法 使 我 
们 能 把 几 个 看 起 来 不 一 样 的 分 析 合 并 成 为 一 个 一 体 化 的 算法 。 比 如 , 在 9.5 节 中 , 我 们 用 四 个 数 
据 流 分 析 组 成 的 序列 及 两 个 中 间 步 又 描述 了 部 分 元 余 消 除 方法 。 在 边 辑 表示 方法 中 , 这 些 步骤 
可 以 被 合并 成 为 一 组 逻辑 规则 。 我 们 可 以 同时 求解 这 些 规 则 。 

12. 3.1 Datalog 简介 

Datalog 是 一 个 使 用 类 Prolog 表示 方法 的 语言 , 但 是 它 的 语义 要 比 Prolog 简单 得 多 。 首 先 ， 
Datalog 的 元 素 是 形 如 p(X,, X2, +, X, MRF (atom), 其 中 : 

1) p 是 一 个 断言 一 一 一 个 表示 了 一 类 语句 的 符号 ， 比如 “一 个 定 值 到 达 了 一 个 基本 块 的 
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开始 处 ”。 

2) X Xe, X, 是 变量 或 常量 的 项 。 我 们 也 可 以 把 一 些 简单 表达 式 当 作 一 个 断言 的 
参数 .9 

一 个 基础 原子 (ground atom) 是 一 个 其 参数 都 是 常量 的 断言 。 每 个 基础 原子 表明 了 一 个 特定 的 
事实 , 它 的 值 要 么 是 真 要 么 是 假 。 把 一 个 断言 表示 为 一 个 关系 (或 者 说 令 该 断言 取 真 值 的 基础 原子 
的 表 ) 通 常 比 较 方便 。 每 个 基础 原子 表示 成 关系 的 一 行 , 或 者 说 一 个 元 组 。 这 个 关系 的 列 以 属性 命 
名 , 对 于 每 个 属性 , 每 个 元 组 都 有 一 个 对 应 的 分 量 。 这 些 属性 对 应 于 用 关系 方式 表示 的 基础 原子 的 
分 量 。 在 该 关系 中 的 所 有 基础 原子 的 值 都 是 真 , 不 在 此 关系 中 的 基础 原子 的 值 都 为 假 。 
ACT 我们 假设 断言 站 (8，D) EREE D IATER BFA BID 
处 ”, 并 假设 对 于 特定 的 流 图 in (by, dy) WEH in(b,, dy) M in(by, ds) 也 为 rae 
真 。 我 们 也 可 以 假设 对 于 这 个 流 图 而 言 , 所 有 其 他 关于 in 的 描述 都 是 假 的 。 by | dy 
那么 图 12-12 中 的 关系 就 表示 了 对 应 于 这 个 流 图 的 此 断言 的 取 值 。 

这 个 关系 的 属性 为 B 和 DD。 这 个 关系 有 三 个 元 组 , AE, 由) 、 图 12-12 使 用 一 
(by, di) 和 (b,, dy) 口 “ 个 关系 来 表示 一 

有 时 我 们 也 会 看 到 一 个 实际 上 是 变量 及 常量 之 间 的 比较 运算 的 原子 。 比 BEOR 
如 Xz 了 或 者 X=10。 在 这 些 例子 中 , 断言 实际 上 是 比较 运算 符 。 也 就 是 说 , 我 们 可 以 把 = 10 看 作 它 
的 断言 形式 : equals(X, 10) 。 但 是 比较 断言 和 其 他 断言 有 一 个 最 大 的 不 同 之 处 。 一 个 比较 断言 有 它 的 
标准 解释 , 而 像 in 这 样 的 普通 断言 的 含义 是 由 一 个 Datalog 程序 (将 在 下 面 描述 ) 定 义 的 。 

字面 值 (iteral) 是 一 个 原子 或 其 否定 形式 。 我 们 在 一 个 原子 前 加 NOT 来 表示 否定 。 因 此 ， 
NOT in(B, DD) 是 一 个 断言 ,表示 定 值 D 不 能 到 达 基 本 块 下 的 开始 处 。 
12.3.2 Datalog 规则 

规则 是 表示 逻辑 推理 关系 的 一 种 方法 。 在 Datalog 中 , 规则 也 说 明了 如 何 完 成 对 正确 的 事实 
的 计算 。 一 个 规则 的 形式 为 : 





























H:- B&B, R&B, 

其 中 的 组 成 部 分 如 下 : 

e HA B, Ba, = B, AFR, 即 原子 或 原子 的 否定 形式 。 但 用 不 能 是 否定 形式 。 

e 凡是 规则 的 头 ,B1、B,、…、B， 组 成 了 规则 的 体 。 

e 每 个 B;, 有 时 被 称 为 规则 的 子 目 标 (subgoal) 。 

我 们 应 该 把 符号 : - 读 作 “ 如果”。 一 个 规则 的 含义 是 “如 果 规 则 体 为 真 , 那么 规则 头 也 为 
真 "。 更 精确 地 说 , 我 们 按照 下 面 的 方法 把 规则 应 用 到 一 组 给 定 的 基础 原子 集合 上 。 考 虑 所 有 可 
能 把 规则 中 的 变量 替代 为 常量 的 替换 方法 。 如 果 某 个 蔡 换 方法 使 得 规则 体 的 每 个 子 目标 都 为 真 
(假设 所 有 且 只 有 给 定 的 基础 原子 为 真 ), 那么 我 们 可 以 推断 : 按照 这 个 蔡 换 方法 把 规则 头 中 的 
变量 替换 为 常量 之 后 得 到 的 断言 为 真 。 不 能 使 所 有 子 目标 都 为 真 的 替换 方法 没有 给 我 们 任何 信 
息 , 替换 后 的 规则 头 可 能 为 真 也 可 能 为 假 。 

一 个 Datalog 程序 是 一 组 规则 的 集合 。 这 个 程序 被 应 用 于 一 组 "数据 ”,， 即 某 些 断言 的 基础 原 
子 集合 。 这 个 程序 的 乡 5 果 也 是 一 组 基础 原子 的 集合 ， 这 个 集合 通过 应 用 程序 中 的 规则 推断 得 到 。 
程序 将 不 断 应 用 其 中 的 规则 , 直到 不 能 推 疡 出 新 的 基础 原子 为 止 。 





O 严格 地 讲 , 这 样 的 项 是 从 函数 符号 构造 而 来 的 。 它 们 大 大 增加 了 Datalog 实现 的 复杂 人 性。 但 是 ， 只 有 在 不 把 事情 
复杂 化 的 情况 下 我 们 才 会 使 用 少量 运算 符 ， 比 如 常量 的 加 法 和 减法 。 
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2 一 个 Datalog 程序 的 简单 例子 是 给 定 一 个 图 的 (有 向 ) 边 , IRAK, a 
是 说 ,断言 edge(X, YRR A — ie 了 到 了 的 边 ”; WI path X, Y) RAM X BY AK 
路 径 。 定 义 路 径 的 规则 是 : 

1) path(X, Y) :— edge(X, Y) 

2) path(X, Y) :— path(X, Z) & path(Z, Y) 

第 -一 个 规则 是 说 一 条 边 就 是 一 条 路 和 从。 也 就 是 说 ， 只 要 我 们 把 变量 到 替换 为 一 个 常量 a 且 
把 变量 了 替换 为 一 个 常量 ,并且 edge(a, pb) 为 真 ( 即 有 一 条 从 结 点 a 到 结 点 5 的 边 ), BBA path 
(a, 8) 也 成 立 ( 即 有 一 条 从 到 的 路 径 ) 。 第 二 个 规则 是 说 如 果 有 一 条 从 某 个 结 点 下 到 某 个 结 
点 Z 的 路 径 , 并 且 还 有 一 条 路 径 从 2Z 到 结 点 了 ,那么 存在 一 条 从 到 了 的 路 径 。 这 个 规则 表示 
“传递 封闭 性 ”。 请 注意 , 任何 路 径 都 可 以 通过 选取 路 径 上 的 边 并 不 断 应 用 传递 封闭 性 规则 得 到 。 

比如 , 假设 下 列 事实 (基础 原子 ) 为 真 : edge(1, 2), edge(2, 3) Medge(3,4). MA, 我们 可 
以 使 用 第 一 个 规则 进行 三 次 不 同 的 蔡 换 , HET path (1, 2), path(2, 3) Al path(3, 4). flan, 按 
AEX =1 和 了 =2 进行 替换 可 以 得 到 第 一 个 规则 的 实例 path(1, 2):- edge(1, 2). FAH edge(1, 
2) 为 真 , 所 以 可 以 推导 出 path(1, 2)。 

根据 这 三 个 关于 path 的 事实 , 我 们 可 以 多 次 使 用 第 二 个 规则 。 如 果 按 照 X=1、Z =2 和 Y=3 进 
ITAR, 我 们 可 以 得 到 这 个 规则 的 实例 path(1, 3) :- path(1, 2)&path(2, 3)。 因 为 规则 体 中 的 两 
re 经 推导 出 来 , 已 知 它们 为 真 , 所 以 可 以 推出 规则 头 : path(1, 3) 。 然 后 , 使 用 替换 方法 

=1, Y=2 MZ =4 推出 规则 头 path(1, 4) 。 也 就 是 说 , 从 结 点 1 到 结 点 4 有 一 条 路 径 。 口 














Datalog 的 编码 规则 | 
我 们 将 在 Datalog 程序 中 使 用 如 下 编码 规则 | 
1) 变量 以 大 写字 符 开头 。 
2) 所 有 的 其 他 元 素 以 小 写字 符 或 其 他 符号 ( 比如 数字 ) 开头 。 这 些 元 素 包 括 断言 5 用 作 
断言 参数 的 常量 。 | 








12.3.3 AE SEMINEE 

按照 Datalog 程序 的 惯例 , 我 们 把 断言 分 成 两 类 : 

1) EDB 断言 ,或 者 说 外 延 数据 库 (extensional database) 断言 , 是 事先 定义 的 断言 。 也 就 是 说 , 它们 
的 真 值 事实 要 么 通过 一 个 关系 或 表 给 出 ， 要 人 么 根据 断言 的 含义 给 出 (比如 Ri à 

2) IDB 断言 , WA ih A 84438 (inensional database) Wis, RAR GLAI E 

一 个 断言 要 么 是 IDB, 要 么 是 EDB, 日 只 能 是 其 中 之 一 。 ces 任何 出 现在 一 
个 或 多 个 规则 头 中 的 断言 必然 是 一 个 IDB 断言 。 出 现在 规则 体 中 的 断言 可 以 是 IDB, 也 可 以 是 
EDB。 比 如 , 在 例子 12. 12 H, edge 是 一 个 EDB WA , path 是 一 个 IDB 断言 。 回 忆 一 下 , 我 们 给 
出 了 一 些 关于 edge 的 事实 ， 比 如 edge(1, 2), 但 是 所 有 的 path 事实 都 是 通过 规则 推导 出 来 的 。 

当 Datalog 程序 用 于 表示 数据 流 算法 时 , 其 中 的 EDB 断言 是 根据 流 图 本 身 计 算得 到 的 。IDB 
断言 被 表示 成 规则 , 而 数据 流 问题 的 解决 方法 就 是 根据 这 些 规则 和 给 定 的 EDB 事实 中 推导 出 所 
有 可 能 的 IDB 事实 。 
DAE 让 我 们 考虑 可 以 如 何在 Datalog 中 表示 到 达 定 值 问题 。 首 先 , 在 语句 层次 上 (而 不 是 
在 基本 块 层 次 上 ) 考 虑 问题 是 有 道理 的 。 也 就 是 说 ， 从 一 个 基本 块 构造 它 的 gen 和 kill 集合 的 计 
算 过 程 将 会 和 到 达 定 值 本 身 的 计算 集成 在 一 起 。 因 此 , 图 12-13 中 给 出 的 基本 块 b 是 很 典型 的 。 
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请 注意 , 如 果 一 个 基本 块 内 有 个 语句 , 那么 我 们 用 编号 1，2，…, 来 标记 块 内 的 程序 点 。 第 : 
个 定 值 在 第 i 点 上 出 现 , 而 在 0 点 上 没有 定 值 出 现 。 

程序 中 的 一 个 点 可 以 表示 为 一 个 二 元 组 (5, n), 其 中 5 是 一 个 基本 块 ,而 
n 是 0 到 基本 块 5 内 的 请 句 数 量 之 间 的 一 个 整数 。 我 们 的 表示 方法 需要 两 个 
EDB Bre: 

1) def(B, N, X) 为 真 当 且 仅 当 基本 块 呈 中 的 第 N 个 语句 可 以 对 变量 站 定 
值 。 比 如 , 在 图 12-13 H, def(b,, 1, x) BH, debi, 3, x) WHA def(51,2， 图 12-13 一 个 语 
Y) 对 所 有 可 能 在 这 个 点 上 被 指针 p 指向 的 变量 了 都 为 真 。 现 在 我 们 将 假设 Y ”名 中 包含 指针 
可 以 是 任何 具有 p 所 指 类 型 的 变量 。 的 基本 块 

2) suce(B，N，C) 为 真 当 且 仅 当 在 流 图 中 基本 块 C 是 基本 块 刀 的 后 继 , 且 B8 具 有 NWN 个 语句 。 
也 就 是 说 ,控制 流 可 以 从 8B 的 点 入 到 达 C 的 点 0。 比 如 , 假设 5 是 图 12-13 中 基本 块 5 的 前 驱 ， 
Bb, BAS 个 语句 ,那么 succ(by, 5, b)) AK. 

这 个 Datalog 程序 有 一 个 IDB 断言 rd(B, N, C, M, XX) 。 这 个 断言 为 真 当 且 仅 当 在 基本 块 C 上 的 第 
MM 个 语句 中 对 变量 的 定 值 到 达 了 基本 块 B 的 点 N。 定义 断言 rd 的 规则 在 图 12-14 中 显示 。 

规则 1 说 明 , 如果 基本 块 8 的 第 N 个 语句 对 X 定 值 , 那么 X 的 这 个 定 值 到 达 B 的 第 NN 个 点 
( 即 紧 跟 在 这 个 语句 之 后 的 点 ) 。 我 们 前 面 给 出 了 到 达 定 值 问题 的 集合 理论 表示 方法 , 而 这 个 规 
则 对 应 于 该 表示 方法 中 的 概念 gen。 

规则 2 表示 除非 一 个 定 值 被 某 个 语句 杀 死 , 否则 它 可 以 穿越 这 个 语句 。 而 杀 死 一 个 定 值 的 叭 
一 方法 是 100% 肯 定 地 对 其 中 的 变量 重新 定 值 。 详 细 地 说 , 规则 2 说 明 来 自 基本 块 C 中 的 第 M 个 
语句 的 对 变量 X 的 定 值 到 达 基 本 块 8 中 的 点 N 的 条 件 是 

1) 它 到 达 了 前 一 个 结 点 , 即 8 中 的 点 NN -1。 

2) 同时 至 少 有 一 个 不 同 于 的 变量 了 可 能 在 B 的 第 尺 个 语句 中 定 值 。 

最 后 , 规则 3 表示 了 流 图 的 控制 流 。 它 说 基本 块 C 中 第 必 个 语句 中 对 的 定 值 到 达 基 本 据 
8 的 第 0 点 的 条 件 是 存在 某 个 具有 WN 个 语句 的 基本 块 D, 使 得 这 个 对 的 定 值 到 达 D 的 结尾 处 ， 
并 且 B 是 的 一 个 后 继 。 口 

例 12. 13 中 的 EDB WE succ 显然 可 以 从 流 图 中 获得 。 如 果 我 们 保守 地 估计 一 个 指针 可 能 指 
向 任何 地 方 , 那么 可 以 从 流 图 中 得 到 def 断言 。 如 果 我 们 希望 把 一 个 指针 所 指向 的 范围 限定 在 具 
有 适当 类 型 的 变量 中 , 那么 我 们 可 以 从 符号 表 中 获取 类 型 信息 ,从 而 使 用 一 个 较 小 的 关系 defo 
另 一 种 可 选 的 方法 是 把 def 变 成 一 个 IDB 断言 ， 并 通过 规则 来 定义 它 。 这 些 规则 将 使 用 更 基本 
EDB 断言 , 而 这 些 断 言 本 身 可 以 从 流 图 和 符号 表 中 获得 。 

[一 假设 我 们 引入 两 个 新 的 EDB 




















1) rd(B,N,B,N,X) :- def(B,N,X) 

1) assign(B, N, X) 为 真 当 且 仅 当 基本 抉 B | "NGMX) i= rB N- 10,M,X t 
的 第 N 个 语句 的 左 部 为 X。 请 注意 , 了 可 以 是 XZY 
一 个 变量 , 也 可 以 是 一 个 具有 左 值 的 简单 表达 | 3) a(B,0,G MX) :- rd(D,N,C,M,X)& 
sk, 比如 * po suce(D, N, B) 

2) 如 果 基 的 类 型 为 了 , ABA type(X, T) 为 
真 。 同 样 , 可 以 是 具有 左 值 的 任意 表达 式 ， 图 12-14 断言 rd 的 规则 集合 


而 了 可 以 是 任何 合法 的 类 型 表达 式 。 
然后 , 我 们 就 可 以 写 出 def 的 规则 , 使 得 def 成 为 一 个 IDB 断言 。 图 12-15 是 对 图 12-14 的 一 
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个 扩展 , 它 增加 了 两 个 def 的 可 能 规则 。 规 则 4 说明, 如 果 基 本 块 中 的 第 N 个 语句 对 不 赋 值 , 那 
么 这 个 语句 就 对 X 定 值 。 规则 5 说 明 , 如 果 基本 块 B 的 第 N 个 语句 对 * 己 赋值 , 且 X 是 具有 P 所 
类 型 的 任何 变量 ， 那么 这 个 语句 也 可 能 对 X 定 值 。 其 他 类 型 的 赋值 语句 需要 其 他 的 def 规则 。 

现在 举例 说 明 如 何 使 用 图 12-15 中 的 规则 
进行 推导 。 让 我 们 重新 考虑 图 12-13 中 的 基本 


块 5,。 第 一 个 语句 把 一 个 值 赋 给 变量 x, 因此 事 | 2) rd(B,NC,M,X) :- rd(B,N -1,C,M,X) & 
def(B,N,Y) & 





1) rd(B,N,B,N,X) :- def(B, NX) 


实 assign(b,, 1, x) HME EDB 中 。 第 三 个 语句 XZY 

x BH, E ir ,) 也 是 一 个 
也 对 FRR.: PS asriar C , 7: x) 也 是 Í 3) rd(B.0,C,M.X) :- rd(D,N,C,M, X) & 
EDB 事实 。 第 二 个 语句 通过 P 间接 赋值 ， 因 此 suce(D, N, B) 


第 三 个 EDB 事实 是 assign(b,,2, *p). HRJ 4 


假设 的 类 型 是 指向 整数 的 指针 (wii)，| MAY umn 


4) def(B,N,X) :-  assign(B,N,X) 











Aix 和 y 都 是 整数 。 那 么 我 们 可 以 使 用 规则 5， type(P, xT) 

S B=b,,N=2, P=p, T=int, HX SF a 

y, 推导 得 到 def(b,, 2, x) Adef( b,,2, 7). Æ 图 12-15 ”断言 rd 和 def 的 规则 

似 地 , 我 们 可 以 对 其 他 类 型 为 整数 或 可 转变 为 整数 的 变量 推导 出 同样 的 结果 。 口 


12.3.4 Datalog 程序 的 执行 

每 一 组 Datalog 规则 都 定义 了 它 的 IDB 断言 的 关系 。 这 些 关系 是 程序 中 的 EDB 断言 关系 表 的 
函数 。 开 始 时 假设 IDB 关系 为 空 ( 即 对 于 所 有 可 能 的 参数 , 各 个 IDB 断言 为 假 ) 。 然 后 重复 应 用 
这 些 规则 , 根据 这 些 规则 不 断 推导 出 新 的 事实 。 当 推导 过 程 收 敛 时 , 就 完成 了 程序 的 运行 。 运 行 
得 到 的 IDB 关系 就 形成 了 程序 的 输出 。 这 个 过 程 将 在 下 面 的 算法 中 正式 给 出 。 这 个 算法 和 第 9 
章 中 讨论 的 迭代 算法 类 似 。 
Datalog TEE DA T oe pree) 
求 值 。 Rp = 0; 


输入 : 一 个 Datalog 程序 和 各 个 while (改变 了 任何 Rp 的 值 ) { ee 
考虑 所 有 可 能 的 对 各 个 规则 中 的 变 景 进行 常量 





EDB 断言 的 事实 集合 。 papel 
输出 : 每 个 IDB 断言 的 事实 集合 。 对 于 每 个 替换 方法 ， 使 用 当前 的 ,来 确定 EDB 和 IDB 断 言 
方法 ; 对 于 程序 中 的 每 个 断言 p， _ 的 起 值 ,确定 是 否 革 个 规则 体 的 所 有 了 目标 都 为 真 

天 Shot = if (SEE R E — ARIRE ) 

SR, 为 使 该 断言 为 真 的 事实 关系 。 如 设 规则 的 头 断 言 为 9， 将 替换 后 的 头 加 入 到 忌 , 中 。 








Rp 是 一 个 EDB 断言 , 那么 R 就 是 该 | } 
断言 给 出 的 所 有 事实 。 如 果 p 是 一 个 
IDB 断言 , 我 们 将 计算 R,。 执 行 图 12-16 
中 的 算法 。 
PE 12.12 中 的 程序 计算 一 个 图 中 的 路 径 。 应 用 算法 12. 15 时 ,最初 EDB 断言 edge 保 
存 了 该 图 的 所 有 边 ， 而 path 的 关系 为 空 。 第 一 轮 的 时 候 , 规则 2 没有 产生 任何 结果 , 因为 此 时 还 
没有 path 的 事实 。 但 是 规则 1 使 得 所 有 的 edge 事实 都 变 成 了 path 事实 。 也 就 是 说 , 在 第 一 轮 过 
后 , 我 们 知道 path(a,5) 成 立 当 且 仅 当 有 一 条 从 a 到 5 的 边 。 

在 第 二 轮 中 , 规则 1 没有 生成 新 的 pah 事实 ,因为 EDB 关系 edge 没有 改变 。 但 是 , MEM 
则 2 令 我 们 把 两 个 长 度 为 1 的 路 径 连接 到 一 起 生成 一 个 长 度 为 2 的 路 径 。 也 就 是 说 , 在 第 二 轮 之 
后 , path(a, 4b) 为 真 当 且 仅 当 从 a 到 5 有 一 条 长 度 为 1 或 2 的 路 径 。 类 似 地 , 在 第 三 轮 中 , 我 们 可 





图 12-16 ”Datalog 程序 的 求 值 
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以 把 长 度 不 大 于 2 的 路 径 连 接 起 来 找到 所 有 长 度 不 大 于 4 的 路 径 。 在 第 四 轮 , 我 们 发 现 最 大 长 度 
为 8 的 路 径 ， 并 且 一 般 来 说 , 在 第 i 轮 之 后 , path(a,5) 为 真 当 且 仅 当 有 一 个 从 a Bb 且 长 度 不 大 
于 2i"1 的 路 径 。 口 
12.3.5 ”Datalog 程序 的 增 量 计算 

有 一 个 可 行 的 方法 可 以 提高 算法 12. 15 的 效率 。 请 注意 ,一 个 新 的 IDB 事实 只 能 在 第 i 轮 被 发 
现 的 条 件 如 下 : 它 是 对 某 一 个 规则 进行 常量 替换 后 的 结果 , 并 且 其 中 至 少 有 一 个 子 目 标 经 过 变换 变 
成 刚刚 在 第 -1 轮 发 现 的 新 事实 。 这 个 论断 的 证 明 如 下 : 如 果子 目标 中 的 所 有 事实 在 第 ; -2 轮 的 
时 候 都 是 已 知 的 , 那么 这 个 “新 "的 事实 应 该 在 第 i-1 工 轮 进行 同样 的 常量 替换 时 就 已 经 被 发 现 了 。 

为 了 利用 这 个 性 质 , 我 们 为 每 个 IDB 断言 p 引入 一 个 断言 newP, 该 断言 只 对 上 一 轮 中 新 发 现 
的 了 事实 成 立 。 每 一 个 在 其 子 目 标 中 包含 了 一 个 或 多 个 IDB 的 规则 都 被 蔡 换 为 一 组 规则 。 这 组 
规则 中 的 每 一 个 都 是 通过 把 原来 规则 体 中 的 某 一 个 IDB 断言 9 HRA new 而 得 到 的 。 最 后 ， 对 
于 所 有 的 规则 , RATE ARMS AAT h 替换 为 new8。 得 到 的 这 些 规 则 被 称 为 具有 增 量 式 形式 
(incremental form) 。 

像 算法 12. 15 那样 ,对 应 于 每 个 IDB 断言 p 的 关系 累积 了 所 有 的 p 的 事实 。 在 每 -- 轮 中 , 我 们 

1) 应 用 新 的 规则 对 newP 断言 求 值 。 

2) 然后 从 newP PRE p, 保证 newP 中 的 事实 确实 是 新 的 。 

3) 把 这 些 newP 的 事实 加 入 到 p 中 。 

4) 把 所 有 newX 关系 表 设 置 为 空 ,准备 进行 下 一 
轮 计算 。 2a) newPath(X,Y) :~- path(X,2)& 

这 个 想法 将 在 算法 12.18 中 正式 描述 。 在 此 之 Res 
前 ,我 们 将 先 给 出 一 个 例子 。 
CIRPE Five A RI 12.12 中 的 Datalog 程序 。 
该 程序 的 规则 的 增 量 形式 在 图 12-17 中 给 出 。 规 则 1 的 ”图 2-17 Datalog 程序 path 的 增 量 式 规则 
规则 体 中 没有 IDB FEAR, 因此 除了 规则 头 之 外 没有 任何 改变 。 但 是 规则 2 中 有 两 个 IDB FEAR, 
因此 它 变 成 了 两 个 不 同 的 规则 。 在 每 个 规则 中 ，, path 在 规则 体 中 的 某 次 出 现 被 蔡 换 为 newPath。 这 
两 个 规则 合 起 来 保证 了 上 面 描述 的 思想 得 以 实 
ii, 即 根据 规则 连接 起 来 的 两 条 路 径 中 至 少 有 | for (每 个 DB 断言 站 | 








1) newPath(X,Y) :-  edge(X,¥) 





5 


newPath( X,Y) :- newPath( X, Z) & 
path(Z,Y) 




































一 条 是 在 上 一 轮 中 发 现 的 。 oy 
Epes Datalog 程序 的 增 量 求 值 。 } 
z z | repeat { 
输入 : 一 个 Datalog 程序 和 各 个 EDB 断言 考虑 对 所 有 规则 中 的 变量 的 所 有 常量 奉 换 方案 ; 
的 事实 集合 。 对 每 个 替换 方案 ,利用 R 和 Raup 来 决定 各 个 
pe EDB 和 IDB 断言 的 真 假 ,从 而 确定 是 否 有 某 个 
输出 : 各 个 IDB 断言 的 事实 集合 。 规则 体 的 所 有 子 目 标 都 为 真 ; 
方法 : 对 于 程序 中 的 每 个 断言 p, OR, K if ( 某 个 末 换 方案 使 得 一 个 规则 的 规则 体 为 真 ) 
示 使 此 断言 为 真 的 事实 的 关系 。 如 果 p 是 一 把 禁 换 后 的 该 规则 的 头 加 入 到 Roop 中 ,其 中 
Seer ae. a 有 是 该 规则 的 头 的 断言 ; 
个 EDB 断言 , 那么 R, 就 是 该 断言 对 应 的 事实 for (每 个 断言 p) { 
集合 。 如 果 p 是 一 个 IDB 断言 , 我 们 将 计算 得 ae ane 一 Rp; 
a er = fp newPs 
到 RR,。 另 外 ,对 于 每 个 IDB KE p, 令 Rsop } as 
为 对 应 于 断言 p 的 “新 "事实 的 关系 。 } until ( 所 有 已 newP 都 为 空 ); 








1) 把 程序 的 规则 修改 为 上 面 描述 的 增 量 
形式 。 12-18 Datalog 程序 的 求 什 
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2) 执行 图 12-18 中 的 算法 。 g 

集合 表示 法 的 增 量 求 值 

以 增 量 的 方式 来 解决 基于 集合 理论 的 数据 流 问 题 也 是 可 行 的 。 比 如 , 在 到 达 定 值 问题 | 

中 ， 只 有 当 一 个 年 值 刚 被 发 现在 基本 块 中 的 前 驱 户 的 OUTLP] 中 时 , 这 个 定 值 才能 够 在 本 次 

计算 中 出 现在 INEB] 中 。 我 们 之 所 以 没有 尝试 以 增 量 的 方式 来 解决 这 样 的 数据 流 问 题 ， 因 为 

位 向 量 的 实现 方式 已 经 非常 高 效 了 。 一 般 来 说 , 直接 计算 整个 向 量 要 比 决定 一 个 事实 是 否 为 
新 事实 更 加 容易 。 














12.3.6 ”有 问题 的 Datalog 规则 

有 些 Datalog 规则 , 或 者 说 程序 , 在 技术 上 没有 任何 意义 , 因此 不 应 该 使 用 。 两 种 最 严重 的 风 
险 是 : 

1) 不 安全 规则 : 这 些 规 则 的 头 中 有 一 个 变量 没有 以 适当 的 方法 出 现在 规则 体 中 。 正 确 的 方 
法 必须 限定 这 个 变量 只 能 取 那 些 出 现在 EDB 中 的 值 。 

2) 不 可 分 层 的 程序 : 一 组 规则 之 间 存 在 涉及 否定 形式 的 循环 定义 。 

我 们 将 详细 讨论 这 两 个 风险 。 l 

安全 规则 

出 现在 某 个 规则 头 的 任何 变量 pee al 不 仅 如 此 , 这 个 变量 所 在 的 子 且 标 
必须 是 一 个 Í ae IDB ek TDR 原子 。 BASS J ee 








p(X, Y) :- q(Z) & NOT r(X) & XY 
是 不 安全 的 。 原 因 有 两 个 : 变量 针 只 出 现在 否定 的 子 目标 r(X) 和 比较 表达 式 X 关 了 中 ; 了 只 出 现 
在 比较 式 中 。 结 果 是 只 要 (X) IRE Y AAF X, p 对 于 无 穷 多 个 二 元 组 (X, Y) 为 真 。 口 

可 分 层 的 Datalog 程序 

为 了 让 一 个 程序 有 意义 , 递归 定义 和 否定 形式 必须 分 开 。 正 式 要 求 如 下 。 我 们 必须 能 够 把 
IDB 断言 分 割 成 为 多 个 层次 (strata), 使 得 如 果 存 在 一 个 规则 ,其 头 断言 为 p 且 有 一 个 形 如 NOT 
4(…) 的 子 目 标 , 那么 g 要 么 是 一 个 EDB, 要 么 是 一 个 层次 低 于 p 的 IDB 断言 。 只 要 满足 这 个 规 
则 , 我 们 就 可 以 用 算法 12. 15 或 算法 12. 18 从 低 到 高 地 对 各 个 层次 求 值 。 首 先 处 理 处 理 较 低层 次 
的 IDB, 在 处 理 较 高 层次 时 把 低层 次 上 的 IDB 当 作 EDB, BÆ, 如 果 我 们 违反 了 这 个 规则 , 那么 
如 下 面 的 例子 所 示 , 迭代 算法 可 能 无 法 收敛 。 

Bi 12, 20: 考虑 下 面 的 由 单个 规则 构成 的 Datalog 程序 : 
p(X) :- e(X) & NOT p(X) 
假设 。 是 一 个 EDB 断言 ,并 且 只 有 e(1) 为 真 。 那 么 P(1) 为 真 吗 ? 

这 个 程序 是 不 可 分 层 的 。 不 管 我 们 把 p 放 在 哪 一 层 , 它 的 规则 中 有 一 个 子 生 标 是 茶 个 IDB 
( 即 p 本 身 ) 的 否定 形式 , Hix IDB( 即 p) 所 在 的 层次 当然 不 会 比 p 的 层次 更 低 。 

如 果 我 们 应 用 上 面 的 迭代 算法 , 我 们 从 R, = 0 Fea, 因此 开始 时 的 答案 是 “不 ; p(1) 不 为 
BL." 但 是 , 因为 e(1) 和 NoT p(1) 都 为 真 , 所 以 第 一 次 迭代 时 推导 出 p(1)。 但 是 , 之 后 的 第 二 次 
迭代 告诉 我 们 p(1) 为 假 。 也 就 是 说 , 在 这 个 规则 中 , 把 天 替换 为 1 不 会 令 我 们 推导 出 p(1)， 因 
为 子 目标 NOT p(1) 为 假 。 类 似 地 , 第 三 次 迭代 说 p(1) 为 真 ， 第 四 次 迁 代 说 它 ER, 如 此 往复 。 
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我 们 断定 这 个 不 可 分 层 的 程序 是 无 意义 的 , 也 不 能 把 它 看 作 一 个 正确 的 程序 。 O 
12.3.7 12.3 节 的 练习 

! 练习 12. 3. 1: 在 这 个 问题 中 , 我 们 将 考虑 一 个 比例 子 12. 13 简单 的 到 达 定 值 数 据 流 分 析 
问题 。 假 设 每 个 语句 本 身 就 是 一 个 基本 块 , 并 且 一 开始 的 时 候 假设 每 个 语句 对 且 只 对 一 个 变量 
定 值 。EDB 断言 pred(1, J) 表示 语句 了 是 语句 了 的 一 个 前 驱 。EDB 断言 defines (1, X) 表示 语句 工 
所 定 值 的 变量 为 X。 我 们 将 使 用 IDB 断言 in, D) All oul, D) 分 别 表示 定 值 D 到 达 语 句 了 的 开 
头 和 结尾 。 请 注意 , 一 个 定 值 实际 上 是 一 个 语句 的 编号 。 图 12-19 是 一 个 Datalog 程序 , 它 表示 计 
算 到 达 定 值 的 常用 算法 。 

请 注意 , 规则 1 是 说 明 一 个 语句 杀 死 了 它 自 己 , 但 是 规则 2 保证 一 个 语句 总 是 在 它 自 己 的 输出 集 
合 中 。 规 则 3 是 普通 的 传递 函数 。 因 为 了 可 以 有 多 个 前 驱 , 所 以 规则 4 表示 了 交汇 运算 的 情况 。 

你 要 解决 的 问题 是 修改 这 些 规则 来 处 理 常见 的 二 义 性 定义 的 情况 ， 比 如 通过 一 个 指针 进行 
赋值 运算 。 在 这 种 情况 下 ,defines (17, X) 对 多 个 不 同 的 了 和 一 个 1 成立。 一 个 定 值 最 好 表示 为 一 
个 二 元 组 (D, X), 其 中 DD 是 一 个 语句 , X 是 一 个 可 能 被 D 定 值 的 变量 。 这 样 做 的 结果 是 , in 和 
out 变 成 了 带 有 三 个 参数 的 断言 。 例 如 , in, D, 2 表示 在 语句 石上 对 天 的 (可 能 的 ) 定 值 到 达 了 
语句 了 的 开始 处 。 

练习 12. 3.2 : 编写 一 个 和 图 12-19 类 似 的 
Datalog 程序 来 计算 可 用 表达 式 。 除 了 断言 defines 
Zab, 再 加 上 一 个 断言 eval(7, X, 0, Y) 。 这 个 断 | D wI) :- defines, X) — 
言说 明 语句 7 使 得 表达 式 Y 0O 了 被 求 值 ， 这 里 0 3) out(2,D) :-  in(I, D) & NOT kill(/, D) 
是 表达 式 中 的 运算 符 ， 例如 +。 4) in, D) :- out(J,D) & pred(J, 1) 

练习 12.3.3; 编写 一 个 和 图 12-19 类 似 的 Data- 
log 程序 来 计算 活 茎 变量。 除了 断言 dgfines 之 外 , 假 
设 一 个 断言 uel, XREN I BATEE X. 

练习 12. 3.4: 9.5 节 中 , 我 们 定义 了 一 个 涉及 六 个 概念 的 数据 流 计算 , 这 些 概念 包括 ; 预 
期 执行 的 、 可 用 的 、 最 早 的 (earlist) 、 可 后 延 的 、 最 后 的 (latest) 和 被 使 用 的 。 假 设 我 们 已 经 编写 
了 一 个 Datalog 程序 。 程 序 中 包含 了 一 些 以 EDB 断言 方式 定义 的 可 以 从 程序 中 获得 的 概念 (例如 
gen 和 kil 信息 ) ; 并 且 使 用 这 些 EDB 断言 和 这 六 个 概念 中 的 其 他 概念 定义 了 每 个 概念 。 这 六 个 
概念 中 的 哪些 概念 依赖 于 哪些 其 他 概念 ?这 些 依赖 关系 中 哪些 是 否定 形式 的 ? 得 到 的 Datalog 程 
序 是 可 分 层 的 吗 ? 

练习 12.3.5: 假设 EDB 断言 edge(X, 了) 包含 下 面 的 事实 : 

edge(1, 2) edge(2, 3) edge(3, 4) 

edge(4, 1) edge(4,5) edge(5, 6) 

1) 使 用 算法 12. 15 中 的 简单 求 值 策略 , 在 这 个 数据 上 模拟 运行 例子 12. 12 中 的 Datalog 程序 。 
给 出 每 一 轮 中 找到 的 path 事实。 

2) 在 这 个 数据 上 模拟 执行 图 12-17 中 的 Datalog 程序 。 该 程序 实现 了 算法 12. 18 中 的 增 量 式 
求 值 策略 。 给 出 每 一 轮 中 找 出 的 path 的 事实 。 

练习 12. 3.6: 下 面 的 规则 

p(X, Y) :— q(X, Z) & r(Z, W) & NOT p( W, Y) 


是 一 个 较 大 的 Datalog 程序 P 的 一 部 分 。 
1) 指出 这 个 规则 的 头 、 规 则 体 和 各 个 子 月 标 。 

















1) kill. D) :~-  defines(I,X) & defines(D, X) 











图 12-19 ”一 个 简单 的 到 达 定 义 分 
析 的 Datalog 程序 
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2) NER E ae AL PY IDB 断言 ? 

3) 哪些 断言 一 定 是 P 的 EDB 断言 ? 

4) 这 个 规则 安全 吗 ? 

5) P 是 可 分 层 的 吗 ? 

练习 12.3.7: 把 图 12-14 中 的 规则 转换 成 为 增 量 形式 。 


12.4 一 个 简单 的 指针 分 析 算 法 


在 本 节 中 , 我 们 开始 讨论 一 个 非常 简单 的 控制 流 无 关 的 指针 别名 分 析 技 术 。 这 个 技术 假设 
被 分 析 程 序 中 没有 过 程 调用 。 我 们 将 在 以 后 各 节 中 说 明 如 何 处 理 过 程 , 首先 给 出 上 下 文 无 关 的 
处 理 方法 , 然后 再 给 出 上 下 文 相关 的 方法 。 控 制 流 相关 会 增加 很 多 复杂 性 , 并 且 对 于 Java 这 样 的 
语言 来 说 ,因为 方法 常常 很 小 , 所 以 控制 流 相关 性 和 上 下 文 相关 性 相 比 就 不 是 那么 重要 。 

在 指针 别名 分 析 中 , 我 们 希望 了 解 的 基本 问题 是 一 对 给 定 的 指针 是 否 可 能 互 为 别名 。 回 答 
这 个 提问 的 方法 之 一 是 对 每 个 指针 计算 下 面 问题 的 答案 :“ 这 个 指针 可 能 指向 哪些 对 象 ?” 如 果 两 
个 指针 可 能 指向 同一 个 对 象 , 那么 它们 可 能 互 为 别名 。 

12.4.1 为 什么 指针 分 析 有 难度 

对 C 语言 程序 进行 指针 别名 分 析 特 别 困难 , 因为 C 程序 可 以 对 指针 进行 任何 和 运算。 实际 上 ， 
程序 可 以 读 人 一 个 整数 并 把 它 赋 给 一 个 指针 , 这么 做 会 使 得 这 个 指针 成 为 程序 中 所 有 其 他 指针 
变量 的 别名 。Java 中 的 指针 称 为 引用 , 对 它们 的 分 析 要 简单 得 多 。 它 不 支持 算术 运算 , 并 且 指 针 
只 能 指向 一 个 对 象 的 开头 。 

指针 别名 分 析 必须 是 过 程 间 分 析 。 没 有 过 程 间 分 析 , 我 们 就 必须 假设 任何 方法 调用 都 可 能 
改变 所 有 可 被 它 访问 的 指针 变量 所 指向 的 内 容 , 造成 所 有 过 程 内 的 指针 别名 分 析 非 常 低 效 。 

支持 间接 函数 调用 的 语言 对 指针 别名 分 析 提 出 了 另 一 个 挑战 。 在 C 语言 中 , 人们 可 以 通过 
调用 一 个 解 引 用 的 函数 指针 来 实现 函数 的 间接 调用 。 在 分 析 被 调用 函数 之 前 , 我 们 需要 知道 这 
个 函数 指针 指向 哪里 。 显 然 , 在 分 析 被 调用 的 函数 之 后 , 我 们 会 发 现 这 个 函数 指针 可 能 指向 更 多 
的 函数 ， 因 此 这 个 过 程 需要 和 迭代 进行 。 

虽然 C 语言 中 的 大 部 分 函数 是 被 直接 调用 的 , 但 是 Java 中 的 虚 方法 使 得 很 多 调用 成 为 间接 
调用 。 给 定 一 个 Java 程序 中 的 调用 x m( , 对象 * 可 能 属于 很 多 个 类 , 这 些 类 都 具有 名 为 m 的 
方法 。 我 们 对 x 的 实际 类 型 了 解 得 越 精确 , 我 们 的 调用 图 也 就 越 精确 。 在 理想 情况 下 , 我们 可 以 
在 编译 时 刻 准确 地 确定 x 的 类 ,从 而 准确 知道 m 指向 哪个 方法 。 

AR A 考虑 下 面 的 Java 语 句 序列 : 


Object o; 
o = new String(); 
n = o.hashCode() ; 


这 里 。 被 声明 为 一 个 Object。 如 果 不 分 析 。o 指向 什么 , 我 们 必须 把 在 各 个 类 中 声明 的 名 为 
“hashCode "的 所 有 方法 都 当 作 可 能 的 调用 目标 。 知 道 " 指向 一 个 String 对 象 将 会 使 过 程 间 分 
析 把 范围 精确 地 缩小 到 在 String 中 声明 的 方法 。 l 口 

也 可 以 使 用 近似 的 方法 来 减少 目标 的 数量 。 比 如 , 我 们 可 以 静态 地 确定 被 创建 的 对 象 的 类 
型 ,然后 把 分 析 范 围 限定 在 这 些 类 型 中 。 但 是 , 如 果 我 们 可 以 在 做 指针 指向 分 析 的 同时 , 利用 指 
针 指 向 信息 动态 地 构造 调用 图 , 就 可 以 得 到 更 加 精确 的 结果 。 更 加 精确 的 调用 图 不 仅仅 可 以 获 
得 更 加 精确 的 结果 , 也 可 以 大 大 减少 分 析 所 需 时 间 。 

指针 指向 分 析 是 很 复杂 的 。 它 不 是 “简单 的 "数据 流 问 题 ,在 这 类 问题 中 我 们 只 需要 模拟 单 
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次 执行 一 个 语句 循环 的 效果 。 在 指针 分 析 中 ， 当 我 们 发 现 一 个 新 的 指针 目标 时 ,我 们 必须 重新 分 
析 所 有 把 这 个 指针 所 指向 的 内 容 赋 给 其 他 指针 的 语句 。 

为 简单 起 见 , 我 们 将 主要 关注 Java。 我 们 将 从 控制 流 无 关 和 上 下 文 无 关 的 分 析 开 始 。 当 前 我 
们 假设 程序 中 没有 方法 调用 。 然 后 ,我 们 描述 如 何在 计算 指针 指向 分 析 结 果 的 同时 动态 地 构造 
调用 图 。 最 后 我 们 将 描述 一 个 处 理 上 下 文 相关 性 的 方法 。 

12. 4.2 一 个 指针 和 引用 的 模型 

假设 我 们 的 语言 可 以 用 下 列 方式 来 表示 和 操作 引用 : 

1) 某 些 程序 变量 的 类 型 为 “指向 了 的 指针 "或 “指向 了 的 引用 ”, 其 中 了 是 一 个 类 型 。 这 些 变 
量 可 以 是 静态 的 ,也 可 能 位 于 运行 时 刻 栈 中 。 我 们 简单 地 称 它 们 为 变量 。 

2) 有 一 个 对 象 的 堆 。 所 有 变量 都 指向 推 中 的 对 象 , 不 指向 其 他 变量 。 这 些 对 象 称 为 堆 对 象 
(heap object) 。 

3) 一 个 堆 对 象 可 以 有 多 个 字段 (field) ,一 个 字段 的 值 可 以 是 指向 一 个 推 对 象 的 引用 (但 是 不 
能 指向 一 个 变量 )。 

可 以 使 用 这 个 结构 很 好 地 对 Java 建 模 , 我 们 将 在 例子 中 使 用 Java 的 语法 。 请 注意 , 在 对 C 
语言 建 模 时 这 个 结构 的 效果 就 不 太 好 ， 因 为 在 C 语言 中 指针 变量 可 以 指向 其 他 指针 变量 。 而 且 ， 
从 原则 上 讲 , 任何 C 语言 的 值 都 可 以 被 强制 转化 成 为 一 个 指针 。 

因为 我 们 进行 的 是 上 下 文 无 关 的 分 析 , 所 以 只 需要 断定 一 个 给 定 的 变量 " 能够 指向 一 个 给 定 
的 堆 对 象 h, 不 需要 指出 在 程序 中 的 什么 地 方 " 可 能 指向 h, 或 者 在 什么 样 的 上 下 文中 4v 可 以 指向 
ho FIER, 变量 可 以 通过 它 的 全 名 来 命名 。 在 Java H, 这 个 全 名 包括 了 模块 、 类 、 方 法 和 方法 中 
的 块 以 及 变量 名 本 身 。 因 此 , 我 们 可 以 区 分 标识 符 相 同 的 多 个 变量 。 

堆 对 象 没 有 名 字 。 因 为 可 能 动态 创建 出 无 限 多 个 对 象 , 所 以 人 们 经 常 使 用 近似 方式 给 对 象 
命名 。 一 个 惯例 是 使 用 创建 对 象 的 语句 来 指定 对 象 。 因 为 一 个 语句 可 以 被 执行 多 次 , 每 次 都 可 
以 创建 一 个 新 的 对 象 ， 因 此 一 个 形 如 “wv 可 以 指向 h” 的 断言 实际 上 是 说 “v 可 以 指向 标号 为 h 的 语 
句 创建 的 一 个 或 者 多 个 对 象 。 

分 析 的 目标 是 确定 各 个 变量 以 及 每 个 谁 对 和 象 的 各 字段 可 能 指向 哪些 对 象 。 我 们 把 这 个 分 析 
称 为 指针 指向 分 析 ( points-to analysis) 。 如 果 两 个 指针 的 指向 集合 相交 ，, 那么 它们 互 为 别名 。 这 里 
我 们 描述 的 是 一 个 基于 包含 (inclusion-based ) 的 分 析 技 术 。 也 就 是 说 , 一 个 形 如 v =w 的 语句 使 得 
变量 v 指 向 w 所 指向 的 所 有 对 象 , 但 是 反 过 来 不 成 立 。 虽 然 这 个 方法 看 起 来 显而易见 , 但 我 们 还 
可 以 使 用 其 他 的 方法 来 定义 指向 分 析 。 比 如 , 我 们 可 以 定义 一 个 基于 等 价 关 系 (equivalence- 
based) 的 分 析 , 使 得 形 如 v =w 的 语句 把 变量 > 和 v 转变 成 一 个 等 价 类 。 等 价 类 中 的 变量 指向 同 
样 的 对 象 。 虽 然 这 种 表示 法 不 能 很 好 地 估算 别名 问题 , 但 它 仍然 为 哪些 变量 指向 同一 类 对 象 的 
问题 提供 了 一 个 快速 的 求解 方法 , 而且 效 果 通 常 很 好 。 

12.4.3 ”控制 流 无 关 性 

我 们 首先 给 出 一 个 很 简单 的 例子 , 说 明 在 指针 指向 分 析 中 忽略 
控制 流 带 来 的 影响 。 

图 12-20 中 创建 了 三 个 对 象 h、i Ay, 并 分 别 赋 给 变量 
a, blco 显然 到 第 3 行 结 束 的 时 候 , a fI h, b JRI i, eH jo 
如 果 接 着 分 析 语 句 4 ~6, 会 发 现在 第 4 行 之 后 , a 只 指向 i 图 12-20 fi) 12. 22 84 

第 5 行 之 后 ,5 只 指向 j。 第 6 行 之 后 c 只 指向 i。 口 Java 代码 
上 上 面 的 分 析 是 控制 流 相 关 的 , 因为 我 们 沿 着 控制 流 计算 了 在 每 个 语句 之 后 各 个 变量 会 指向 哪个 对 














h: a = new Object(); 
i: b= new Object(); 
j: c= new ObjectQ); 
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象 。 换 名 话说 ,除了 考虑 各 个 语句 生成 哪些 指向 信息 之 外 , 我 们 也 考虑 了 每 个 语句 “ 杀 死 了 "哪些 指向 
信息 。 比 如 , 语句 Pb =c; 杀 死 了 之 前 的 事实 “2 指向 站 并 生成 了 新 的 关系 “6 指向 c 所 指向 的 东西 ”。 

一 个 控制 流 无 关 分 析 忽 略 了 控制 流 。 这 么 做 实质 上 就 是 假设 被 分 析 程 序 中 的 各 个 语句 可 以 

按照 任何 顺序 执行 。 它 只 计算 一 个 全 局 性 的 指向 映射 , 这 个 映射 指明 了 每 个 变量 在 程序 执行 的 
各 点 上 可 能 指向 哪些 对 象 。 如 果 一 个 变量 在 程序 中 两 个 不 同 语句 的 执行 之 后 指向 两 个 不 同 的 对 
象 , 我 们 只 记录 它 可 能 指向 这 两 个 对 象 。 换 名 话说 , 在 控制 流 无 关 分 析 中 , 任何 赋值 都 不 会 “ 杀 
死 "任何 指向 关系 ,而 是 只 能 “生成 "更 多 的 指向 关系 。 为 了 计算 控制 流 无 关 分 析 的 结果 , 我 们 不 
断 向 指针 指向 关系 中 加 入 各 个 语句 的 效果 ,直到 无 法 找到 新 的 关系 为 目 。 显 然 , 缺乏 控制 流 相关 
性 大 大 弱化 了 分 析 的 结果 , 但 是 这 么 做 通常 可 以 降低 为 表示 分 析 结 果 而 使 用 的 数据 的 大 小 ， 并 使 
SAA RIMS, . 
i 12. 23 EE 12. 22, 第 1 行 到 第 3 行 仍然 告诉 我 们 a 可 以 指向 A; b 可 以 指向 i;c 可 以 指 
向 j。 根据 第 4 行 和 第 5 行 , a 可 以 指向 入 和 i; 可 以 指向 i 和 j。 根据 第 6 行 ,c 可 以 指向 hh、i 和 和 
j。 这 个 信息 又 影响 了 第 5 行 , 接着 又 影响 了 第 4 行 。 最 后 , 我 们 只 得 到 一 个 没有 用 的 结论 ， 即 任 
何 指针 可 能 指向 任何 对 象 。 口 
12.4.4 在 Datalog 中 的 表示 方法 

现在 我 们 基于 上 面 的 讨论 把 一 个 控制 流 无 关 的 指针 别名 分 析 正 式 表示 出 来 。 现 在 忽略 过 程 
调用 , 并 将 关注 四 种 可 能 影响 指针 的 语句 : 

1) 对 象 创建 : h: Tv=new T); ”这 个 语句 创建 了 一 个 新 的 堆 对 象 , HERE o 可 以 指向 它 。 

2) 复制 语句 : v=w; ”这 里 v 和 w 是 两 个 变量 。 这 个 语句 使 得 2 指向 w 当前 所 指 的 堆 对 象 ， 
即 w 被 复制 到 ov 中 。 l 

3) 字段 保存 : v. f =w; 2 所 指向 的 对 象 类 型 必须 有 一 个 字段 上 并 且 这 个 字段 必须 是 某 一 
种 引用 类 型 。 令 v 指 向 堆 对 和 象 h, 并 令 w 指向 g。 这 个 语句 使 得 关中 的 字段 和 现在 指向 g。 请 注 
意 , 变量 v 的 值 没有 改变 。 

4) 字段 读 取 ; V=w.f; 这 里 zw 是 一 个 指向 某 个 具有 字段 /的 堆 对 象 的 变量 ,而 /指向 某 个 
堆 对 象 h。 这 个 语句 使 得 变量 wv 指向。 

请 注意 , 源 代码 中 的 复合 字段 访问 ,比如 v =w. fg, 可 以 被 分 解 为 两 个 基本 的 字段 读 取 语句 : 

vi = wf; 

v = vig; 


现在 , 我 们 把 这 个 分 析 用 Datalog 规则 正式 表示 出 来 。 首 先 , 只 需要 计算 两 个 1DB 断言: 

1) pts(V, 五) 表示 变量 V 可 能 指向 一 个 堆 对 象 H。 

2) hpts(H, F, G) RREN R H IFE F a RE IERA Go 

EDB 关系 根据 程序 本 身 构造 得 到 。 因 为 在 控制 流 无 关 的 分 析 中 , 程序 中 语句 的 位 置 和 分 析 无 关 ， 
所 以 只 需要 在 EDB 中 确定 程序 中 是 否 存在 某 种 形式 的 语句 。 在 接 下 来 的 内 容 中 , 我 们 将 做 一 个 方便 的 
简化 。 我 们 没有 定义 专门 的 EDB 关系 来 存放 从 程序 中 获取 的 信息 ， 而 是 使 用 带 引 号 的 语句 的 方式 来 指 
明 一 个 或 者 多 个 EDB 关系 。 这 些 关系 表示 程序 中 存在 这 样 的 语句 。 比 如 ,“ 卫 :TV = new TC)" 是 一 个 
EDB FX, 它 表 示 在 语句 瑟 中 有 一 个 赋值 使 得 变量 了 指向 一 个 新 的 类 型 为 了 的 对 象 。 在 实践 中 , 我 们 
假设 有 一 个 对 应 的 EDB 关系 , 其 中 包含 的 基础 原子 和 程序 中 这 种 形式 的 语句 一 一 对 应 。 

根据 这 种 约定 , 我 们 在 编写 Datalog 程序 时 要 做 的 全 部 工作 就 是 为 上 面 的 四 种 语句 中 的 每 一 
种 写 出 一 个 规则 。 相 应 的 程序 在 图 12-21 中 给 出 。 规 则 1 说 明 如 果 请 句 ## 是 把 一 个 新 对 象 赋 给 V 
的 赋值 语句 ,变量 了 就 可 能 指向 堆 对 象 如。 规则 2 说 明 如 果 存 在 一 个 复制 语句 V=W, 并 且 下 可 
以 指向 五 , 那么 了 也 可 以 指向 五 。 
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pis’, H) “H: TW = new T()” 


pis(V, H) yg 
pts(W, H) 


“VF = WwW & 
pts(W,G) & 
pts(V, H) 


3) hpts(H, F.C) 


4) pis(V, H) “V = WF? & 
pts(W,G) & 


hpts(G, F, H) 











图 12-21 控制 流 无 关 指针 分 析 的 Datalog 程序 


规则 3 说 明 , 如 果 存 在 一 个 形 如 V. F =W 的 请 句 , WG, FAV TD, RAH 
MFR FALE Go Bla, 规则 4 说 明 , 如 果 存 在 一 个 形 如 V =W. F 的 语句 , 下 可 以 指向 G6, 并 
且 G6 的 字段 可 以 指向 五, 那么 V 可 以 指向 了。 请 注意 , pts 和 hpts 是 相互 递归 的 , 但 是 这 个 Data- 


log 程序 可 以 用 任何 一 个 在 12. 3.4 节 中 讨论 的 迭代 算法 进行 求 值 。 
12.4.5 使 用 类 型 信息 

因为 Java 是 类 型 安全 的 ,变量 只 能 指向 和 它 的 声明 类 型 相 兼容 的 类 
型 。 比 如 , 把 一 个 属于 一 个 变量 的 声明 类 型 的 超 类 的 对 和 象 赋 给 这 个 变量 
将 引发 一 个 运行 时 刻 异常 。 考 虑 图 12-22 中 的 简单 例子 , 其 中 5 是 7 的 子 
类 。 如 果 为 真 , 这 个 程序 将 引发 一 个 运行 时 刻 异 常 , 因为 a 不 能 被 赋予 
一 个 类 型 为 7 了 的 对 象 。 这 样 ， 因 为 类 型 约束 的 原因 , 我 们 可 以 静态 地 断 
E a 只 能 指向 hh 而 不 能 指向 go 

因此 , 我 们 在 分 析 技 术 中 引入 三 个 EDB 断言 。 这 些 断 言 反映 了 被 分 
析 代 码 中 的 重要 类 型 信息 。 我 们 将 使 用 下 面 的 断言 ; 

1) v7ype(V, 7) 表 示 变 量 V 被 声明 为 类 型 7。 





b= new TO; 
} else 

b = new S(); 
} 
Ais 


b; 








图 12-22 具有 类 型 错 
WRAY Java 程序 


2) h7ype( 石 , 了) 表示 堆 对 象 昌 在 分 配 时 具有 类 型 了。 如 果 一 个 被 创建 的 对 象 是 由 某 个 核心 代码 例 程 
返回 的 , 那么 有 可 能 不 能 精确 决定 它 的 类 型 。 此 时 , 被 创建 对 象 的 类 型 可 以 被 保守 地 设 定 为 所 有 可 能 的 














类 型 。 
3) assignable(T, S) 表示 类 型 为 S 的 对 象 可 以 被 1) pts(V.H) :- “H: TV =newT()” 
赋值 给 一 个 类 型 为 了 的 变量 。 这 个 信息 通常 是 从 程序 | ?) pts(VH) :1:- “VV=W"g& 
中 子 类 型 的 声明 中 收集 的 ,同时 也 包含 了 关于 语言 中 eae 
预定 义 类 的 信息 。assignable(T, T) 总 是 取 真 值 。 hType(H, S) & 
我 们 可 以 修改 图 12-21 中 的 规则 , 使 得 只 有 当 asnmale 3) 
被 赋值 变量 被 赋予 的 堆 对 象 的 类 型 是 可 赋值 类 型 | 3) hpts(H,F,G) :- “VF=W"e 
时 才 可 以 进行 推理 。 新 的 规则 在 图 12-23 中 显示 。 mist.) 
我 们 首先 修改 规则 2。 新 规则 的 最 后 三 个 子 目 | mg 
标 表示 我 们 可 以 断定 了 可 以 指向 交 的 条 件 是 了 和 | pis(W,G) & 
HER H OAS TAS, 并 且 类 型 为 $ 的 对 Lay 
象 可 以 被 赋 给 指向 类 型 了 的 变量 。 规 则 4 中 也 增加 hType(H, S) & 
了 一 个 类 似 的 附加 约束 。 请 注意 , 在 规则 3 中 没有 pnt) 
附加 约束 , 因为 所 有 的 保存 运算 必须 通过 变量 进 ” 图 12.23 向 控制 流 无 关 指针 分 析 增 加 类 型 约束 
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行 ,而 这 些 变量 的 类 型 已 经 被 检查 过 了 。 在 其 中 加 入 的 任何 类 型 约束 只 能 多 处 理 一 种 情况 , 即 基 
对 象 为 null 常量 的 情况 。 
12.4.6 12.4 节 的 练习 





练习 12. 4. 1: 在 图 12-24 中 , h 和 g 用 于 表示 新 创建 对 象 的 标号 , 它们 | BTS 7 nee Th 
不 是 代码 的 一 部 分 。 你 可 以 假设 类 型 为 了 的 对 象 有 一 个 字段 /。 使 用 本 节 | rea 
中 的 Datalog 规则 来 推导 出 所 有 可 能 的 pts 和 Apts 事实 。 T 

| 练习 12.4.2: 对 下 列 代码 Td= c.f; 





8: Ta = new TQ); 
h: a= new T(); 图 12-24 BEY 12.4.1 


TERAS 
f 的 代码 
应 用 本 节 中 的 算法 将 可 以 推导 出 a 和 2 都 可 能 指向 疡 和 8&。 如 果 代码 写成 l 
8: Ta= new TO; 
h: T b= new TO; 
Tc= b; 


我 们 就 能 够 精确 地 推导 出 a 可 能 指向 h, 且 和 < 可 能 指向 g。 请 给 出 一 个 可 以 避免 这 种 不 精确 
情况 的 过 程 内 数据 流 分 析 技术 。 

| 练习 12. 4. 3: 如 果 我 们 用 图 1221 中 的 规则 2 所 描述 的 复制 运 
敌 来 模拟 函数 调用 和 返回 操作 ,就 可 以 把 本 节 中 的 分 析 技术 扩展 为 过 | PE a, 
程 间 分 析 技术 。 也 就 是 说 ,一 个 调用 把 实在 参数 复制 到 相应 的 形式 参 at = x 
数 中 ,而 函数 返回 运 等 把 存储 返回 值 的 变量 复制 到 被 赋予 调用 结果 的 | } 
变量 中 。 考 虑 图 12-25 的 程序 。 














void main() { 


1) 对 这 个 -代码 进行 控制 流 无 关 的 分 析 。 g: Tb = new TQ); 
2) 某 些 在 问题 1 中 做 出 的 推导 实际 上 是 “假冒 的 ”， 也 就 是 说 它们 SE 











并 不 表示 任何 可 能 在 运行 时 刻 产 生 的 事件 。 这 个 问题 的 源头 可 以 追溯 | } 
到 对 变量 的 多 次 赋值 。 改 写 图 12-25 中 的 代码 , 使 得 没有 变量 被 多 次 
赋值 。 对 修改 后 的 代码 再 次 分 析 , 说 明 每 个 推导 得 到 的 ps 和 hpis 的 事 图 12-25 指针 指向 分 析 
实 都 会 在 运行 时 刻 发 生 。 EIR 
12.5 ”上下文 无 关 的 过 程 间 分 析 

现在 我 们 考虑 方法 调用 。 我 们 首先 解释 如 何 使 用 指针 指向 分 析 技 术 来 获得 精确 的 调用 图 ， 
而 调用 图 又 可 以 用 于 计算 精确 的 指针 指向 分 析 结果 。 然 后 , 我 们 正式 描述 如 何 动态 地 生成 调用 
图 , 并 说 明 如 何 用 Datalog 简洁 地 描述 这 个 分 析 过 程 。 
12.5.1 一 个 方法 调用 的 效果 

在 Java F, 一 个 形 如 x =y.n(z) 的 方法 调用 对 指针 指向 关系 的 影响 可 以 计算 如 下 : 

1) 确定 接收 对 象 的 类 型 ， 也 就 是 y 所 指向 对 象 的 类 型 。 假 设 它 的 类 型 是 :。 令 m 是 最 低 的 具有 名 
为 n 的 例 程 的 :的 超 类 中 的 那个 名 为 4 的 例 程 。 请 注意 ,一般 情况 下 只 能 动态 确定 被 调用 的 方法 。 

2) 方法 mm 的 形式 参数 被 赋予 了 实在 参数 所 指向 的 对 象 。 实 在 参数 不 仅仅 包括 直接 传递 的 参 
数 ， 也 包括 接收 对 象 本 身 。 每 个 方法 调用 把 接收 对 象 赋 给 this FEO, RME this 变量 当 作 
各 个 方法 的 第 0 个 形式 参数 。 在 x =y n(z) 中 有 两 个 形式 参数 : y 所 指向 的 对 象 被 赋 给 变量 
this, 而 z 所 指向 的 对 象 被 赋 给 m 中 声明 的 第 一 个 形式 参数 。 














O 请 记 住 ,变量 是 通过 它们 所 属 的 方法 进行 区 分 的 ,因此 有 很 多 个 名 字 为 this 的 变量 ,程序 中 的 每 个 方法 有 一 个 
this 变量 。 
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3) 方法 mm 的 返回 对 象 被 赋 给 这 个 赋值 语句 的 左 部 变量 。 

在 上 下 文 无 关 分 析 中 ,参数 和 返回 值 都 由 复制 语句 建 模 。 尚 待 解决 的 一 个 有 意思 的 问题 是 
如 何 确定 接收 对 象 的 类 型 。 我 们 可 以 根据 这 个 变量 的 声明 保守 地 确定 它 的 类 型 。 比 如 , 被 声明 
变量 的 类 型 为 1, 那么 只 有 1 的 某 个 子 类 型 中 名 字 为 n 的 方法 会 被 调用 。 遗 憾 的 是 , 如 果 被 声明 变 
MMW Object, 那么 所 有 名 为 的 方法 都 是 可 能 的 调用 目标 。 在 密集 使 用 对 象 层次 结构 和 
包含 了 大 型 类 库 的 实际 程序 中 ,这 个 方法 可 能 会 得 到 很 多 虚假 的 调用 目标 ,使 得 分 析 过 程 既 缓慢 
又 不 精确 。 

我 们 需要 知道 被 分 析 的 变量 可 能 指向 什么 样 的 对 象 ， 以便 计算 出 调用 目标 。 但 是 , 除非 我 们 
知道 了 调用 目标 , 否则 无 法 找 出 所 有 这 些 变 量 会 指向 什么 样 的 对 象 。 这 个 递归 关系 要 求 我 们 在 
计算 指针 指向 集合 的 同时 找 出 调用 目标 。 这 个 分 析 需 要 不 断 进行 ,直到 找 不 到 新 的 调用 目标 和 
新 的 指针 指向 关系 为 止 。 

在 图 12-26 的 代码 中 , r 是; 的 一 个 子 类 , 而 


本 身 又 是 :的 一 个 子 类 。 如 果 只 使 用 声明 类 型 的 信息 进行 Dog ， = aO {return neu rO; 1 





分 析 ， a. n() 可 以 调用 在 上 述 代码 中 声明 的 三 个 名 为 nA class s extends t { 
方法 中 的 任何 一 个 , 因为 和 + 都 是 。 的 声明 类 型 :的 子 | BP taO {return nev s0; } 
类 型 。 不 仅 如 此 ， 看 起 来 在 第 5 行 之 后 a 可 以 指向 对 象 g、 class r extends s { 
hMi 3) i: , t n() { return new r(); } 


通过 分 析 程 序 中 指针 指向 关系 , 我 们 首先 确定 a 可 以 l 
指向 j, 而 j 是 一 个 类 型 为 1 的 对 象 。 因 此 , 第 1 行 中 声明 的 | j EO Lo, 
方法 是 一 个 调用 目标 。 分 析 第 1 行 , 我 们 确定 a 也 可 能 指 | 5) a= a.n(); 

向 g, 而 g 是 一 个 类 型 为 ， 的 对 象 。 因 此 , 第 3 行 中 声明 的 

方法 也 可 能 是 一 个 调用 目标 , 且 现 在 a 可 能 也 指向 i, 而 i 。 ”图 12.26 _ 个 虚拟 方法 调用 

是 另 一 个 类 型 为 > 的 对 象 。 因 为 没有 发 现 更 多 的 新 调用 目 

标 , 这 个 分 析 过 程 终止 了 。 它 既 没有 分 析 第 2 行 中 声明 的 方法 , 也 没有 断定 a 可 能 指向 ho 口 
12.5.2 在 Datalog 中 发 现 调 用 图 

为 了 写 出 上 下 文 无 关 的 过 程 间 分 析 的 Datalog 规则 , 我 们 引入 三 个 EDB 断言 , 每 个 断言 都 能 
够 从 源 代 码 中 轻易 获得 : 

1) actual(S, 7，P) 表示 了 是 调用 点 3S 上 的 第 了 个 实在 参数 。 

2) formal(M, I, VRF V EDE M 中 声明 的 第 1 个 形式 参数 。 

3) cha(T, N, M) 表 示 在 一 个 类 型 为 了 的 接收 对 象 上 调用 N 时 实际 调用 的 方法 是 M(cha 是 
class hierarchy analysis( 类 层次 结构 分 析 ) 的 缩写 ) 。 

调用 图 的 每 个 边 都 被 表示 为 一 个 IDB 断言 invokes。 当 我 们 找到 的 调用 图 的 边 越 来 越 多 时 , 根 









































据 参数 被 传人 及 返回 值 被 传 出 的 情况 , 我们 会 得 到 越 站 GD Ss VIM E 
来 越 多 的 指针 指向 关系 。 这 个 效果 被 总 结 为 图 12-27 pts(V, H) & 

hType(H,T) & 
中 的 规则 。 cha(T N, M) 

第 一 个 规则 计算 了 调用 点 的 调用 目标 。 也 就 是 | ， 
) pis(V,H) :-  invokes(S,M) & 

W, “S: V.N(...)" 表 明 存 在 一 个 标号 为 $ 的 调用 点 ， formal(M,1,V) & 
它 调 用 了 由 了 指向 的 接收 对 象 的 名 为 的 方法 。 这 些 o 
子 目标 表示 ， 如 果 了 可 以 指向 实际 类 型 为 了 的 堆 对 象 





H, 并 且 效 是 在 调用 7 类 型 的 对 象 时 所 使 用 的 方法 ， ”图 12.27 发 现 调 用 图 的 Datalog 程序 
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那么 调用 点 S 可 能 调用 方法 M, 

第 二 个 规则 说 明 , 如 果 调 用 点 S 可 以 调用 方法 型 , 那么 六 的 每 个 形式 参数 都 可 能 指向 本 次 调 
用 中 相应 的 实在 参数 所 指向 的 任何 对 象 。 处 理 返回 值 的 规则 留 作 练 习 请 读者 自行 完成 。 

把 这 两 个 规则 和 12. 4 节 中 解释 的 规则 组 合 起 来 , 我 们 就 建立 了 一 个 使 用 调用 图 的 上 下 文 无 
关 的 指针 指 加 分 析 方 法 。 其 中 的 调用 图 是 在 分 析 的 同时 动态 生成 的 。 这 个 分 析 的 副作用 是 使 用 
上 下 文 无 关 和 控制 流 无 关 的 指针 指向 分 析 生 成 了 一 个 调用 图 。 相 对 于 那个 只 根据 类 型 声明 和 语 
法 分 析 得 到 的 调用 图 , 这 个 调用 图 要 精确 得 多 。 

12.5.3 动态 加 载 和 反射 

Java 这 样 的 语言 支持 类 的 动态 加 载 。 因 此 分 析 一 个 程序 执行 的 所 有 代码 是 不 可 能 的 , 也 就 不 
可 能 静态 地 给 出 任何 对 调用 图 和 指针 别名 的 保守 的 估算 。 静 态 分 析 只 能 基于 被 分 析 代 码 给 出 一 
个 近似 。 请 记 住 , 这 里 描述 的 所 有 分 析 都 可 以 在 Java 字 节 码 的 层次 上 应 用 , 因此 不 需要 检查 它们 
的 源 代码 。 这 个 选项 非常 重要 ,因为 Java 程序 常常 使 用 很 多 的 类 库 。 

即使 假设 已 经 分 析 了 所 有 被 执行 的 代码 , 还 有 一 个 更 加 复杂 的 机 制 使 得 我 们 不 可 能 进行 保 
守 分 析 : 反射 机 制 。 反射 机 制 允许 程序 动态 地 决定 将 要 创建 的 对 象 的 类 型 、 被 调用 的 方法 的 名 字 
: 以 及 被 访问 的 字段 名 。 这 些 类 型 、 方 法 和 字段 名 可 以 通过 计算 获得 , 也 可 以 根据 用 户 输入 获得 ， 
因此 一 般 情况 下 唯一 可 能 的 近似 估算 就 是 假设 什么 都 有 可 能 。 

ARA 下 面 的 例子 给 出 了 反射 机 制 的 常见 用 法 : 

1) String className = ...; 

2) Class c = Class.forName(className) ; 

3) Object o = c.newInstance(); 

4) Tt = (T) o; 
其 中 的 Class 库 中 的 方法 forName 的 输入 是 一 个 包含 了 类 名 的 字符 囊 , 它 返回 这 个 类 。 方法 
newInstance 返回 该 类 的 一 个 实例 。 对 象 。 的 类 型 被 强制 转换 成 为 所 有 预期 类 的 超 类 T, 而 不 
是 直接 把 Object 当 作 。 的 类 型 。 口 

虽然 很 多 大 的 Java 应 用 使 用 反射 机 制 , 但 它们 通常 使 用 一 些 常 见 的 习惯 用 法 ， 比 如 例子 
12.25 中 给 出 的 用 法 。 只 要 这 个 应 用 没有 重新 定义 类 加 载 器 , 我 们 就 可 以 在 知道 className 的 
值 时 指出 这 个 对 象 所 属 的 类 。 如 果 className 的 值 是 在 程序 中 定义 的 , AX Java 中 的 字符 串 是 
不 可 变 的 , 那么 知道 className 指向 什么 值 就 可 以 知道 这 个 类 的 名 字 。 这 个 技术 是 指针 指向 分 
析 的 另 一 个 应 用 。 如 果 className 的 值 是 基于 用 户 输入 的 , 那么 指针 指向 分 析 可 以 帮助 确定 这 
个 值 是 在 哪里 输入 的 , 而 开发 者 就 可 以 限定 这 个 值 的 取 值 范围 。 

类 似 地 , 我 们 可 以 利用 类 型 强制 转换 语句 ， 即 例子 12. 25 中 的 第 4 行 , 来 估算 动态 创建 的 对 
象 的 类 型 。 假 设 没有 重新 定义 强制 类 型 转换 的 异常 处 理 程 序 , 那么 这 个 对 象 必然 属于 类 型 了 的 
某 一 个 子 类 。 

12.5.4 12.5 节 的 练习 

练习 12.5.1: 对 于 图 12-26 中 的 代码 ; 

1) 构造 EDB 关系 actual, formal FI cha, 

2) 推导 出 所 有 可 能 的 pts 和 hips 事实 。 

! 练习 12.5.2. 你 将 如 何 向 12. 5.2 节 中 的 EDB 断 育 和 规则 中 加 入 附加 的 断言 和 规则 来 处 
理 下 面 的 情况 : 如 果 一 个 方法 调用 返回 了 一 个 对 象 , 那么 被 赋值 为 这 个 调用 结果 的 变量 可 能 指向 
任何 用 以 存放 返回 值 的 变量 所 指向 的 任何 对 象 。 











12.6 上下文 相关 指针 分 析 


12. 1.2 节 中 讨论 过 , 上 下 文 相关 性 可 以 大 大 提高 过 程 间 分 析 的 精确 性 。 我 们 讨论 了 两 种 过 
程 间 分 析 的 方法 ， 一 种 基于 克隆 的 方法 ( 见 12.1.4 $), 男 一 种 是 基于 摘要 的 方法 ( 见 12.1.5 
节 ) 。 那 么 我 们 应 该 使 用 哪 一 个 方法 呢 ? 

在 计算 指针 指向 信息 的 摘要 时 有 几 个 难点 。 首 先 ,这 些 摘要 很 大 。 每 个 方法 的 摘要 必须 包 
括 这 个 函数 和 所 有 被 调用 者 可 能 做 出 的 所 有 更 新 所 产生 的 影响 。 这 些 影响 需要 用 输入 参数 来 表 
示 。 也 就 是 说 , 一 个 方法 可 能 改变 的 指向 集合 包括 : 所 有 可 通过 静态 变量 及 输入 参数 到 达 的 所 有 
数据 的 指向 集合 , 以 及 由 该 方法 及 被 调用 方法 所 创建 的 全 部 对 象 的 指向 集合 。 虽 然 人 们 已 经 给 
出 了 复杂 的 解决 方案 , 但 是 现在 还 没有 解决 方法 可 以 被 应 用 到 大 型 程序 中 。 即 使 摘要 可 以 通过 
自 底 向 上 的 方式 计算 得 到 , 但 如 何在 -个 典型 的 自 项 向 下 处 理 过 程 中 计算 所 有 上 下 文 环境 下 的 
指针 指向 集合 是 一 个 更 大 的 问题 。 因 为 上 下 文 环境 的 数量 可 能 按照 指数 级 增长 。 这 样 的 信息 对 
于 一 些 全 局 性 查询 是 必须 的 ， 比 如 在 代码 中 找 出 指向 某 个 特定 对 象 的 所 有 指针 。 

在 本 节 中 , 我 们 将 讨论 基于 克隆 的 上 下 文 相关 分 析 技术 。 基 于 克隆 的 分 析 直 接 为 每 个 感 兴趣 的 
上 下 文 都 给 出 一 个 对 应 方法 的 克隆 。 然 后 , 我 们 对 克隆 得 到 的 调用 图 进行 上 下 文 无 关 分 析 。 虽 然 这 
个 方法 看 起 来 简单 , 但 最 大 的 难点 在 于 如 何 处 理 大 量 克隆 的 细节 。 有 多 少 个 上 下 文 ? 即使 我 们 像 
12. 1. 3 中 讨论 的 那样 把 所 有 递归 调用 环 塌 缩 为 一 个 点 , 在 一 个 Java 应 用 中 找到 10 个 上 下 文 的 情况 
也 并 不 少见 。 把 这 么 多 上 下 文 的 分 析 结 果 用 某 种 方式 表示 出 来 是 我 们 所 面临 的 挑战 。 

我 们 把 对 上 下 文 相关 性 的 讨论 分 成 两 个 部 分 : 

1) 如 何在 逻辑 上 处 理 上 下 文 相关 性 ?这 个 部 分 较为 简单 , 因为 可 以 直接 对 克隆 得 到 的 调用 
图 应 用 上 下 文 无 关 的 分 析 算 法 。 

2) 如 何 表示 指数 量 级 的 上 下 文 ? 方法 之 一 是 把 这 个 信息 表示 为 一 个 二 分 决策 图 ( BDD)。 这 
是 一 个 经 过 高 度 优化 的 数据 结构 ,曾经 用 于 很 多 其 他 的 应 用 。 

这 个 处 理 上 下 文 相关 性 的 方法 很 好 地 说 明了 抽象 方面 的 重要 性 。 我 们 将 说 明 如 何 应 用 人 们 
多 年 来 在 BDD 抽象 方面 所 做 的 工作 来 消除 算法 的 复杂 性 。 我 们 可 以 用 很 少 几 行 Datalog 程序 来 表 
示 一 个 上 下 文 相关 的 指针 指向 分 析 。 而 这 个 程序 利用 了 已 有 的 几 千 行 用 于 BDD 数据 操作 的 代 





码 。 这 个 方法 具有 多 个 重要 的 优势 。 首 先 , 它 使 得 人 们 能 够 比较 容易 地 表示 那些 利用 指针 指向 


分 析 结 果 进 行 深度 分 析 的 技术 。 无 论 如 何 , 指针 指向 分 析 结 果 本 身 并 不 令 人 感 兴趣 。 第 二 , 它 使 
得 正确 写 出 这 个 分 析 方 法 的 任务 变 得 容易 得 多 , 因为 它 利 用 了 很 多 行经 过 充分 调试 的 代码 。 
12. 6. 1 上 下 文 和 调用 串 

下 面 描述 的 上 下 文 相关 的 指针 指向 分 析 假设 我 们 已 经 计算 得 到 了 一 个 调用 图 。 这 个 假设 有 
助 于 我 们 使 用 紧凑 的 方式 来 表示 多 个 调用 上 下 文 。 为 了 得 到 调用 图 , 我 们 首先 运行 一 次 上 下 文 
无 关 的 指针 指向 分 析 过 程 。12. 5 节 讨论 过 , 这 个 分 析 过 程 同 时 生成 了 调用 图 。 现 在 我 们 描述 如 
何 创建 克隆 的 调用 图 。 

调用 串 形 成 了 活路 的 函数 调用 的 历史 ,而 一 个 上 下 文 就 是 一 个 调用 串 的 表示 形式 。 另 一 个 
看 待 上 下 文 的 方法 是 把 它 看 作 一 个 调用 序列 的 摘要 。 这 些 调用 的 活动 记录 当前 位 于 运行 时 刻 栈 
中 。 如 果 栈 中 没有 递归 函数 , 那么 这 个 调用 串 ( 即 调用 了 栈 中 函数 的 位 置 的 序列 ) 是 一 个 完全 表 
示 。 同 时 它 也 是 一 个 可 接受 的 表示 方式 ,因为 只 有 有 限 多 个 不 同 的 上 下 文 。 虽 然 上 下 文 的 个 数 
可 能 是 程序 中 函数 数量 的 指数 级 。 

但 如 果 程 序 中 存在 递归 函数 , 那么 可 能 的 调用 串 的 数目 是 无 穷 的 , 我 们 不 能 用 所 有 可 能 的 调 
用 串 来 表示 不 同 的 上 下 文 。 可 以 使 用 多 个 方法 来 限制 不 同 的 上 下 文 的 数目 。 比 如 , 我 们 可 以 编 
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写 一 个 描述 了 所 有 可 能 调用 串 的 正则 表达 式 ,然后 使 用 3. 7 节 中 的 方法 把 这 个 表达 式 转化 成 为 一 
个 确定 的 有 穷 状态 自动 机 。 之 后 , 各 个 上 下 文 就 可 以 使 用 这 个 自动 机 的 状态 来 标识 。 

这 里 , 我 们 将 采用 一 个 更 简单 的 方案 , 它 包含 非 递 归 调 用 的 全 部 历史 , 但 是 把 递归 调用 当 作 
“难以 分 拆 ” 的 内 容 。 我 们 首先 找 出 程序 中 相互 递归 调用 的 函数 的 集合 。 这 个 过 程 很 简单 ， 因 此 
这 里 不 再 详细 讨论 。 考 虑 一 个 以 程序 中 各 个 函数 为 结 点 的 图 。 如 果 函 数 p 调用 了 函数 9, 那么 图 
中 就 存在 一 条 从 结 点 p 到 4 的 边 。 这 个 图 的 强 连 通 分 量 (SCC ) 就 是 相互 递归 调用 函数 的 集合 。 下 
面 的 这 个 特例 很 常见 。 一 个 函数 p 调用 了 它 自身 , 但 是 它 不 在 包含 了 其 他 函数 的 SCC H, BAR 
数 p 本 身 是 一 个 SCC, 而 所 有 的 非 递归 函数 本 身 也 是 SCC。 如 果 一 个 SCC 具有 多 个 成 员 ( 即 相互 
递归 调用 的 情况 ) , 或 者 它 包含 唯一 一 个 递归 成 员 , 我们 就 说 这 个 SCC 是 非 平凡 的 (nontrivial) 。 
单个 非 北 归 函 数组 成 的 SCC 是 平凡 SCC, 

前 面 有 一 个 规则 说 任何 调用 串 都 是 一 个 上 下 文 ， 我 们 对 这 个 规则 做 如 下 修改 。 给 定 一 个 调 
用 串 ， 如 果 下 面 情况 成 立 就 删除 一 个 调用 点 * 的 出 现 : 

1) s 在 一 个 函数 p 中 。 

2) 函数 9 在 调用 点 * 处 被 调用 (有 可 能 g =p). 

3) p 和 9 位 于 同一 个 强 连通 分 量 中 ( 即 p 和 9 相互 递归 调用 , 或 者 p=9 Ep 是 递归 函数 ) 。 

这 么 做 的 结果 是 ， 当 一 个 非 平凡 SCC 的 成 员 S 被 调用 时 , 这 个 调用 的 调用 点 变 成 了 上 下 文 的 
一 部 分 , 但 是 在 S 中 对 同一 SCC 中 其 他 函数 的 调用 都 不 在 这 个 上 下 文中 。 最 后 , 当 一 个 8 之 外 的 
调用 发 生 时 , 我 们 把 该 调用 点 记录 为 这 个 上 下 文 的 一 部 分 。 

DIRE 图 12-28 中 给 出 了 五 个 函数 的 略图 , 图 中 给 出 了 一 些 调用 点 和 这 些 函 数 中 的 调用 。 


检查 一 下 这 些 调用 就 会 发 现 ,g 和 7 是 相互 递归 的 。 但 是 p、s 和 ? 
根本 不 会 递归 调用 。 因 此 , 我 们 的 上 下 文 将 是 除了 s3 Ass 之 外 | "ia POT 








h:a = new T() 
的 所 有 调用 点 的 列表 。 函 数 g 和 之 间 的 递归 调用 就 发 生 在 s3 si: Tb = q(a); 
s2 s(b); 
和 s5 处 。 } 
让 我 们 考虑 从 p Bc 的 所 有 路 径 ,也 就 是 所 有 调用 了 + 的 上 下 文 : | ， and 
1) p 可 以 在 s2 处 调用 ;, 然后 * 可 以 在 s7 或 者 s8 处 调用 i。 FE aay ETA 
因此 ,两 个 可 能 的 调用 串 是 ( s2 ，s7) 和 (s2，s8 ) 。 Sere ae 
2) p 可 以 在 sl 处 调用 g。 然 后 , g Mr 可 以 多 次 递归 地 调用 return d; 
} 


对 方 。 我 们 把 这 个 环 打开 : 
© 在 s4 处 , :直接 被 g 调用 。 这 个 选择 可 以 得 到 唯一 的 上 | T raoa 


s5: Te = q(x); 
下 文 (sl1， s4)o s6: ay 
@ 在 s6 处 , r 调 用 ;。 这 里 , 我 们 可 以 通过 在 s7 处 或 s8 处 aye 





的 调用 到 达 1;。 这 么 做 给 出 了 两 个 新 的 上 下 文 (sl1，s6，s7) 和 

(sl, s6, s8)。 AA f = t(y); 
因此 , 总 共有 五 个 不 同 的 上 下 文 调用 了 +。 请 注意 , 所 有 这 些 s8: f= t(£); 

上 下 文 都 省 略 了 递归 调用 点 s3 和 s5。 比 如 ， 上下文 (s1，s4 ) 

实际 上 表示 了 对 应 于 调用 串 (s1, s3, (s5, s3)", s4) 的 无 穷 集 |T TIC lne 10; 

合 , RP n20, 口 return g; 
现在 我 们 描述 一 下 如 何 得 到 克隆 调用 图 。 每 一 个 被 克隆 的 方法 

都 使 用 程序 中 的 方法 M 和 一 个 上 下 文 C 来 标识 。 在 原 调用 图 的 边 上 ” 图 12-28 与 一 个 运行 实 

加 上 相应 的 上 下 文 就 可 以 得 到 克隆 后 的 调用 图 的 边 。 请 注意 , 在 原 调 。 ” 例 对 应 的 函数 和 调用 点 
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用 图 中 有 一 条 连接 调用 点 5 和 方法 M 的 边 的 条 件 是 断言 invokes(5, 六) 为 真 。 为 了 增加 上 下 文 以 标识 
克隆 调用 图 中 的 例 程 , 我 们 可 以 定义 一 个 相应 的 断言 CSinvokes, CSinvokes(S, C, M, DD) 为 真 的 条 件 是 
上 下 文 C 中 的 调用 点 S HATH M EFE D 
12.6.2 在 Datalog 规则 中 加 入 上 下 文 信息 

为 了 找 出 上 下 文 相关 的 指针 指向 关系 , RM 1) pts(¥.C.H) 





:- SH: TV =newT()" & 











可 以 直接 把 相同 的 上 下 文 无 关 指 针 指 向 分 析 技 术 CSinvokes(H,C, -, -) 
应 用 到 克隆 的 调用 图 上 。 因 为 在 这 个 克隆 的 调用 | eaten) :os 
图 中 的 方法 是 用 原 方法 和 它 的 上 下 文 来 表示 的 ， pts(W, C, H) 
我 们 相应 地 修正 了 所 有 的 Datalog 规则 。 为 简单 起 | 3) hpts(H,FG) :- “VP=W"g 
见 , 下 面 的 规则 不 包括 类 型 约束 , 且 符 号 ” ”表示 pts(W,C,G) & 
了 任何 新 的 变量 。 eR 
IDB 断言 zk 中 必须 增加 一 个 表示 上 下 文 的 参 |9 PC 有 :- pein 
数 。 断 言 ps(V, C, ARAL PRC 中 的 变量 了 hpts(G, F, H) 
HY LAFE HER HA, TAT LE ABE fie OA 5) pts(V,D.H) :- CSinvokes(S,C, M, D) & 
的 , 但 规则 5 是 一 个 例外 。 规 则 5 表示 , 如 果 上 下 formal(M,1,V) & 
文 C 中 的 调用 点 8 调用 了 上 下 文 D 的 方法 M, W eae Ne 
么 上 下 文 D 的 方法 让 的 形式 参数 可 能 指向 由 上 下 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
文 C 中 的 相应 实在 参数 指向 的 对 象 。 图 12-29 上 下 文 相关 的 指针 指向 分 析 的 Datalog 图 


12.6.3 关于 相关 性 的 更 多 讨论 

上 面 我 们 描述 的 是 一 个 上 下 文 相关 性 的 公式 化 表示 。 这 个 方法 已 经 体现 出 实用 性 。 使 用 下 
一 节 将 要 描述 的 一 些 技 巧 , 它 就 能 够 处 理 很 多 真实 的 大 型 Java 程序 。 虽 然 如 此 , 这 个 算法 还 是 不 
能 处 理 最 大 型 的 Java 应 用 。 

在 这 个 表示 方法 中 , 堆 对 象 是 通过 它们 的 调用 点 来 命名 的 , 但 是 却 不 具有 上 下 文 相关 性 。 这 
个 简化 处 理 可 能 引起 一 些 问题 。 考 虑 一 下 对 象 工厂 设计 设计 模式 , 这 个 设计 模式 中 同一 类 型 的 
所 有 对 象 都 由 同一 个 例 程 分 配 。 当 前 的 表示 方案 会 使 得 那个 类 的 所 有 对 象 都 共享 同一 个 名 字 。 
应 对 这 一 情况 的 比较 容易 的 方法 是 把 相应 的 对 象 创建 代码 进行 实质 上 的 内 联 处 理 。 在 处 理 更 具 
一 般 性 的 情况 时 , 我 们 期 望 提高 对 象 命名 的 上 下 文 相关 性 。 虽 然 | voia po t 





很 容易 向 Datalog 规则 中 加 入 对 象 的 上 下 文 相 关 信 息 , 但 是 要 使 得 a 
相应 的 分 析 方法 能 够 被 用 于 大 规模 程序 则 是 另 一 个 问题 了 。 cl: Te = qlasb); 


男 一 个 相关 性 的 重要 形式 是 对 象 相 关 性 。 一 个 对 象 相关 的 技 ‘ 
术 可 以 区 分 在 不 同 的 接收 对 象 上 调用 的 方法 。 我 们 考虑 一 下 这 样 |T q(T x, Tpi 


j: Td = new TO; 


的 场景 : 在 某 个 调用 点 所 处 的 上 下 文中 有 一 个 变量 可 能 指向 同一 ae ay 
个 类 的 两 个 不 同 的 接收 对 象 。 这 两 个 不 同 的 接收 对 象 的 字段 可 能 a Ge ete 
指向 不 同 的 对 象 。 如 果 不 区 分 接收 对 象 ， 在 由 this 对 象 引 用 的 l return d; | 


字段 之 间 的 复制 语句 将 产生 虚假 的 指向 关系 , 除非 我 们 对 不 同 的 | } 

接收 对 象 分 别 进行 分 析 。 在 有 些 分 析 中 , 对 象 相关 性 要 比 上 下 文 | T rai 

相关 性 更 加 有 用 。 

12.6.4 12.6 节 的 练习 
练习 12. 6. 1: 如 果 我 们 把 本 节 中 的 方法 应 用 到 图 12-30 中 的 ”图 1239 练习 12.6 1 和 练习 

RBE, 我 们 能 够 区 分 的 上 下 文 有 哪些 ? 12.6.2 的 代码 


return Z; 
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{ 练习 12.6.2: 对 图 12-30 中 的 代码 进行 上 下 文 相关 性 分 析 。 
! 练习 12.6.3: 按照 12.5 节 中 的 方法 , 扩展 本 节 中 的 Datalog 规则 , 使 之 包含 类 型 和 子 类 型 信息 。 


12.7 使 用 BDD 的 Datalog 的 实现 


二 分 决策 图 ( Binary Decision Diagram，BDD) 是 一 个 用 图 来 表示 布尔 函数 的 方法 。 因 为 对 n 个 
变量 有 22 个 布尔 函数 ,没有 哪 种 表示 方法 能 够 很 简洁 地 表示 所 有 的 布尔 函数 。 但 是 , 在 实践 中 
出 现 的 布尔 函数 常常 具有 很 多 规律 。 因 此 ， 人 们 常常 可 以 找到 一 个 BDD 来 简洁 地 表示 他 们 想 要 
表示 的 布尔 函数 。 

我 们 为 了 分 析 程序 而 开发 了 一 些 Datalog 程序 。 事 实 表明 , 用 这 些 Datalog 程序 描述 的 布尔 函 
数 也 不 例外 , 也 可 以 使 用 BDD 简洁 地 表示 。BDD 方法 在 实践 中 是 相当 成 功 的 , 虽然 我 们 需要 通 
过 商业 BDD 操作 程序 包 中 的 一 些 启发 式 规则 或 技术 才 可 以 找到 用 以 表示 程序 信息 的 简洁 的 
BDD。 值 得 一 提 的 是 , 它 比 使 用 传统 数据 库 管理 系统 的 方法 具有 更 好 的 性 能 ,因为 传统 数据 库 管 
理 系 统 是 为 了 在 典型 商业 数据 中 出 现 的 更 加 不 规则 的 数据 模式 而 设计 的 。 

讨论 经 过 多 年 开发 才 得 到 的 所 有 BDD 技术 已 经 超出 了 本 书 的 范围 。 我 们 将 在 这 里 介绍 BDD 的 
表示 方法 。 然 后 , 指出 如 何 把 一 个 关系 数据 表示 成 为 BDD。 在 用 诸如 算法 12. 18 的 算法 来 执行 Dat- 
alog 程序 时 需要 进行 某 些 运算 。 我 们 也 指出 了 如 何 操作 BDD 来 完成 这 些 运算 。 最 后 , 我们 描述 了 如 
何在 BDD 中 表示 指数 量 级 的 上 下 文 。 这 种 表示 法 是 在 上 下 文 相关 性 分 析 中 成 功 应 用 BDD 的 关键 。 
12.7.1 二 分 决策 图 

一 个 BDD 把 一 个 布尔 函数 表示 成 为 一 个 带 根 的 DAG 图 。 这 个 DAG 的 每 个 内 部 结 点 都 用 被 
表示 函数 的 一 个 变量 作为 标号 。 在 图 的 底部 是 两 个 叶子 ,一 个 标号 为 0, 另 一 个 标号 为 1。 每 个 
内 部 结 点 有 两 条 指向 子 结 点 的 边 , 这 两 条 边 分 别称 为 “ 低 边 "和 “高 边 "。 低 边 对 应 于 该 结 点 对 应 
变量 取 值 为 0 时 的 情况 ， 而 高 边 对 应 于 相应 变量 取 值 为 1 时 的 情况 。 

给 定 这 些 变量 的 一 个 真 假 赋值 , 我 们 可 以 从 DAG 的 根 开始 确定 函数 的 取 值 。 在 每 个 结 点 上 ， 

比如 说 标号 为 * 的 结 点 上 ,分 别 根据 * 的 真 假 值 为 0 或 1 来 决定 沿 着 相应 的 低 边 或 高 边 前 进 。 如 
果 我 们 最 后 到 达标 号 为 1 的 叶 结 点 , 那么 被 表示 的 函数 对 于 这 个 真 假 赋值 取 真 值 ， 否则 该 函数 取 
假 值 。 
OBEI 在 图 12-31 中 , 我 们 看 到 一 个 BDD。 稍 后 会 看 到 它 所 表示 的 函数 。 请 注意 , RNE 
经 把 所 有 的 “ 低 " 边 标记 为 0, 所 有 的 “高 " 边 标记 为 1。 考 虑 对 于 变量 wyz 的 真 假 赋值 : w = =y 
=0, z=1。 从 根 结 点 开始 , 因为 w = 0, 我 们 选取 低 边 , 从 而 走 到 最 左 的 标号 为 * 的 结 点 。 因 为 
x20, 我 们 还 是 从 这 个 结 点 沿 着 低 边 到 达 最 左 的 标号 为 y 的 结 点 。 因 为 y=0, 我 们 下 一 步 移动 到 
最 左 的 标号 为 z 的 结 点 。 现 在 , 因为 z=1, 我 们 将 选择 高 边 并 最 后 到 达标 号 为 1 的 叶子 结 点 。 我 
们 的 结论 是 ,这 个 函数 相对 于 这 个 真 假 赋值 取 真 值 。 

现在 考虑 真 假 赋值 wzyz =0101, 也 就 是 说 =y=0, x=z=1。 我 们 还 是 从 根 结 点 开始 。 因 为 
w=0, 我 们 还 是 移动 到 最 左边 的 标号 为 * 的 结 点 。 但 这 一 次 因为 *=1, 我 们 沿 着 高 边 直接 跳 到 叶子 
结 点 0。 也 就 是 说 , 我 们 不 仅 知道 真 假 赋值 0101 使 得 这 个 函数 为 假 , 而 且 因为 不 需要 查看 y 或 者 z 
的 值 , 任何 形 如 01yz 的 真 假 赋值 都 会 使 得 这 个 函数 取 值 为 0。 这 个 “短路 "能 力 是 BDD MAHR K 
数 的 简洁 表示 方法 的 理由 之 一 。 口 

图 12-31 中 内 部 结 点 分 为 多 个 层次 一 一 每 个 层 中 的 结 点 都 使 用 同一 个 特定 的 变量 作为 标号 。 
虽然 这 并 不 是 一 个 绝对 的 要 求 , 但 把 我 们 的 讨论 范围 限制 在 排序 BDD 之 内 会 带 来 方便 。 在 一 个 
排序 BDD 中 , 相应 的 变量 有 一 个 排序 x1 , x， …, x ,并 且 不 论 何 时 有 一 条 从 标号 为 x; 的 父 结 点 
到 标号 为 5 的 子 结 点 的 边 就 意味 着 i<j。 我 们 将 看 到 ,操作 排序 BDD 相对 容易 ,并 且 从 现在 开 
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始 我 们 假设 所 有 的 BDD 都 是 排序 的 。 








图 12-31 一 个 二 分 决策 图 


还 需要 注意 的 是 , BDD 是 有 疝 无 环 图 ( DAG), 而 个 是 树 。 不 仅仅 叶子 结 点 0 和 1 通常 有 很 多 
父 结 点 ,内 部 结 点 也 可 能 具有 多 个 父 结 点 。 比 如 , 在 图 12-31 中 最 右 的 标号 为 z 的 结 点 有 两 个 父 
结 点 。 把 得 到 同样 结果 的 多 个 结 点 合并 起 来 也 是 BDD 通常 比较 简洁 的 理由 之 一 。 
12.7.2 ”对 BDD 的 转换 

在 上 面 的 讨论 中 , 我 们 提 到 了 两 个 简化 BDD 的 方法 , 它们 可 以 使 得 BDD 更 加 简洁 : 

1) 短路 : 如 果 一 个 结 点 N 的 低 边 和 高 边 都 到 达 同 一 个 结 点 OM, 那么 我 们 可 以 消除 N。 原 来 
进入 NN 的 边 直接 进入 M, 

2) HASH: 如 果 两 个 结 点 NN 和 MM 的 两 条 低 边 都 到 达 同 一 个 结 点 , 并 且 两 条 高 边 也 到 达 同 
一 个 结 点 , 那么 我 们 可 以 把 NN 和 MM 合并 。 原 来 进入 NN 或 者 M 的 边 都 进入 合并 后 的 结 点 。 

也 可 以 在 相反 的 方向 上 进行 这 两 个 转换 。 特 别 地 , 我 们 可 以 在 从 WNW 到 M 的 边 上 引入 一 个 结 
点 。 从 引入 结 点 流出 的 高 边 和 低 边 都 到 达 结 点 M, 而 原来 从 NN 到 M 的 边 现在 到 达 这 个 刚 被 引入 
的 结 点 。 但 是 请 注意 , 新 结 点 的 标记 变量 必须 是 按照 排序 处 于 N 和 A 履 之 间 的 某 一 个 变量 。 
图 12-32 给 出 了 这 两 个 转换 的 图 示 。 
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12.7.3 用 BDD 表示 关系 

我 们 至 今 为 止 处 理 的 关系 都 具有 从 “ 域 "中 取 值 的 分 量 。 一 个 关系 的 菜 个 分 量 的 域 是 该 关系 
的 各 个 元 组 的 相应 分 量 的 可 能 取 值 的 集合 。 比 如 ,关系 pV, M 的 第 一 个 分 量 的 域 为 所 有 程序 
变量 ,而 第 二 个 分 量 的 域 为 所 有 对 象 创建 语句 。 如 果 一 个 域 具有 多 于 2"-! 个 可 能 取 值 目 不 多 于 
2" 个 可 能 值 , 那么 它 需 要 n 个 二 进 制 位 (或 者 说 布尔 变量 ) 来 表示 这 个 域 中 的 值 。 

因此 , 我 们 可 以 用 一 组 布尔 变量 来 表示 关系 元 组 的 各 个 分 量 的 域 中 的 值 。 关 系 的 一 个 元 组 
可 以 被 看 作 是 这 组 布尔 变量 的 走 假 赋值 。 我 们 可 以 把 关系 看 作 是 这 组 布尔 变量 上 的 一 个 布尔 函 
数 。 该 函数 对 于 某 个 真 假 赋值 返回 真 值 ， 当 且 仅 当 这 个 赋值 表示 了 此 关系 中 的 一 个 元 组 。 下 面 
的 例子 可 以 说 明 这 个 想法 。 
考虑 一 个 关系 r(4, B), JEP AMB 的 域 都 是 |a, b, c, d| 。 我 们 将 把 二 进 制 位 00 
作为 a 的 编码 , 01 对 应 于 5, 10 对 应 于 c 以 及 11 对 应 于 d SRR r 的 元 组 为 : 


A 
a | b 
a 
d| c 


我 们 使 用 布尔 变量 wx 来 对 第 一 个 分 量 (4) 进行 编码 , 使 用 变量 yz 为 第 二 个 分 量 (B) BETTS 
码 。 那 么 关系 7 就 变 成 了 : 





也 就 是 说 , 关系 7 被 转换 成 为 一 个 对 三 个 真 假 赋 值 wxyz = 0001, 0010 和 1110 取 真 值 的 布尔 
函数 。 请 注意 , 这 三 个 二 进 制 序列 恰巧 就 是 图 12-31 中 从 根 结 点 到 达 叶 子 结 点 1 的 路 径 上 的 标 
号 。 也 就 是 说 , 如 果 使 用 上 述 编码 方法 , 在 那个 图 中 的 BDD 表示 了 这 个 关系 r。 口 
12.7.4 用 BDD 操作 实现 关系 运算 

现在 , 我 们 看 到 了 如 何 把 关系 表示 成 BDD。 但 是 , 要 实现 像 算法 12. 18( Datalog 程序 的 增 量 
式 求 值 ) 那 样 的 算法 , 我 们 还 需要 能 够 操作 BDD 以 反映 相应 关系 上 的 运算 。 下 面 给 出 了 我 们 要 完 
成 的 主要 的 关系 运算 : 

1) 初始 化 : 我 们 需要 创建 一 个 BDD 来 表示 一 个 关系 的 单个 元 组 。 我 们 将 通过 合并 运算 把 这 
些 表示 单个 元 组 的 BDD 集成 到 表示 大 型 关系 的 BDD 中 去 。 

2) 合并 : 为 了 表示 关系 的 合并 , 我 们 使 用 布尔 函数 的 逻辑 OR 运算 来 表示 得 到 的 关系 。 这 个 
运算 不 仅 用 来 构造 初始 关系 , 也 用 于 把 具有 相同 头 断 言 的 多 个 规则 的 结果 合并 起 来 , 还 会 用 于 把 
新 的 断言 事实 合并 到 老 事 实 的 集合 中 去 。 算 法 12. 18 要 求实 现 这 些 运 算 。 

3) 投影 : 当 我 们 对 一 个 规则 体 求 值 的 时 候 , 我 们 需要 构造 出 由 那些 使 得 规则 体 取 真 值 的 元 
组 所 殖 含 的 头 断言 的 关系 。 从 表示 这 个 关系 的 BDD 的 角度 来 说 , 我 们 需要 消除 其 中 的 一 些 结 点 ， 
这 些 结 点 的 布尔 变量 标号 没有 用 来 表示 头 关 系 中 的 分 量 。 我 们 可 能 还 需要 对 BDD 中 的 某 些 变量 
重新 命名 , 以 使 得 它们 和 头 关 系 分 量 的 布尔 变量 相对 应 。 

4) 连接 : 为 了 找 出 令 一 个 规则 体 为 真 的 变量 的 赋值 组 合 , 我 们 需要 把 对 应 于 各 个 子 目标 的 关系 
“连接 "起 来 。 比 如 , 假设 我 们 有 两 个 子 目标 r(4, 8)&s(B, C)。 这 些 子 目 标的 关系 的 连接 是 满足 下 列 
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条 件 的 三 元 组 (a, b, WIRA: (a, 5) 是 7 的 关系 中 的 一 个 元 组 , Ab, c) 是 ; 的 关系 的 一 个 元 组 。 我 
们 将 看 到 , 在 对 BDD 中 的 布尔 变量 重新 命名 , 使 得 对 应 于 两 个 B 分 量 的 变量 同名 之 后 , 这 个 BDD 操作 
和 逻辑 AND 运算 类 似 , 而 逻辑 AND 运算 和 在 BDD 上 实现 关系 合并 的 逻辑 OR 运算 类 似 。 

单一 元 组 的 BDD 

为 了 初始 化 一 个 关系 ,我们 需要 使 用 一 种 方法 来 为 那些 只 对 单个 真 假 赋 值 取 真 值 的 项 数 构 
造 BDD。 假 设 布 尔 变量 为 xi ,xs,，…, Xx， 并 且 这 个 唯一 的 真 假 赋值 为 a1a，…a,, 其 中 每 个 a; 是 
0 或 1。 相 应 的 BDD 对 于 每 个 x; 有 一 个 结 点 N;。 如 果 ai =0, 那么 Ni 的 高 边 直接 到 达 叶 子 结 点 
0, 而 低 边 到 达 结 点 Ni 或 在 i=n 时 到 达 叶 子 1。 如 果 a; =1, 我 们 进行 同样 的 处 理 ， 只 是 高 边 
和 低 边 顺序 相反 。 

这 个 策略 给 出 了 一 个 BDD, 它 能 够 检查 每 个 x;(i=1, 2, …, n) 是 否 具 有 正确 的 值 。 一 旦 找 
到 不 正确 的 值 , 我们 就 直接 跳 转 到 叶子 结 点 0。 只 有 当 所 有 变量 的 取 值 都 正确 时 ,我 们 才 会 在 最 
后 到 达 叶 子 结 点 1 处 。 

作为 例子 , 可 以 回 到 前 面 的 图 12-33b。 这 个 BDD 表示 了 一 个 当日 仅 当 x =y =0( 即 真 假 赋值 
为 00 时 ) 才 取 真 值 的 函数 。 

合并 ; 
我 们 将 详细 地 给 出 一 个 算法 来 计算 BDD ASE OR, 也 就 是 这 两 个 BDD 所 表示 的 关系 的 
合并 。 
BDD 的 合并 。 

输入 : 两 个 排序 的 BDD, 它们 的 变量 集合 相同 , 且 排 序 也 相同 。 

输出 : 一 个 BDD, 它 表示 的 函数 是 两 个 输入 BDD 所 表示 的 布尔 函数 的 逻辑 OR. 

HE: 我 们 将 描述 一 个 合并 两 个 BDD 的 递归 过 程 。 这 个 过 程 按照 BDD 中 出 现 的 变量 集合 的 
大 小 进行 归纳 。 

归纳 基础 : 零 个 变量 。 这 两 个 BDD 必然 都 是 叶子 结 点 , 其 标号 是 1 或 0。 如 果 两 个 输入 中 有 一 -个 
是 1, 那么 输出 就 是 标号 为 1 的 叶子 结 点 ; 如 果 两 个 输入 都 是 0, 那么 输出 叶子 结 点 的 标号 是 0。 

归纳 步骤 : 假设 两 个 BDD 中 总 共 出 现 了 上 个 变量 yi ,yi ，…，, Yro 执行 下 列 步骤 : 

1) 如 果 必 要 , 使 用 反 向 的 短路 转换 加 入 一 个 新 的 根 , 使 得 两 个 BDD 的 根 的 标号 都 是 yi 。 

2) 设 两 个 BDD 的 根 为 N 和 MM, 令 它 们 的 低 边 子 结 点 分 别 为 N MAM, 它们 的 高 边 子 结 点 分 
别 为 W 和 M1。 对 分 别 以 No 和 My 为 根 的 两 个 BDD 递归 地 应 用 这 个 算法 。 同 时 也 对 分 别 以 Ni 
和 M, 为 根 的 两 个 BDD 应 用 这 个 算法 。 在 得 到 的 两 个 BDD F, 第 一 个 BDD 表示 的 函数 取 真 值 的 
条 件 是 : 相应 的 真 假 赋值 中 =0, 并 且 它 使 得 两 个 输入 BDD 中 的 一 个 或 全 部 取 真 值 。 第 二 个 
BDD 表示 同样 的 函数 , 不 过 其 中 的 yi =1. 

3) 创建 一 个 新 的 标号 为 yi 的 根 结 点 。 它 的 低 边 子 结 点 是 通过 递归 构造 得 到 的 第 一 个 BDD 
HRA, 而 它 的 高 边 子 结 点 是 第 二 个 BDD 的 根 结 点 。 

4) 在 刚刚 通过 合并 得 到 的 BDD 中 把 两 个 标号 为 0 的 叶子 结 点 合并 , 同时 把 两 个 标号 为 1 的 
叶子 结 点 合并 。 

5) 在 可 能 的 时 候 应 用 合并 和 短路 转换 , 简化 得 到 的 BDD。 
在 图 12-33a 和 图 12-33b 中 有 两 个 简单 的 BDD。 第 一 个 BDD 表示 函数 x OR y, 而 第 
二 个 BDD 表示 函数 
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图 12-33 Awe HE OR 构造 BDD 


请 注意 , 它们 的 逻辑 OR 的 结果 是 常量 函数 1， 即 永 真 函数 。 对 这 两 个 BDD 应 用 算法 12. 29 
时 , 我 们 考虑 两 个 根 的 低 边 子 结 点 和 它们 的 高 边 子 结 点 。 我 们 先 考 虑 后 者 。 

在 图 12-33a 中 , 根 的 高 边 子 结 点 是 1, 而 在 图 12-33b 中 的 相应 子 结 点 是 0。 因 为 这 两 个 子 结 
点 都 在 叶子 层次 上 , 所 以 不 需要 在 每 条 边 上 插入 标号 为 y 的 结 点 , 尽管 我 们 这 么 做 会 得 到 同样 的 
结果 。 结 点 0 和 1 的 合并 是 算法 中 归纳 基础 的 情况 , 合并 后 生成 一 个 标号 为 1 的 叶子 结 点 。 这 个 
叶子 结 点 将 成 为 新 的 根 结 点 的 高 边 结 点 。 

图 12-33a 和 图 12-33b 中 的 祖 的 低 边 结 点 的 标号 都 是 y7, 因此 我 们 递归 地 计算 它们 的 合并 
BDD。 这 两 个 结 点 的 低 边 子 结 点 的 标号 分 别 为 0 和 1, 因此 它们 的 低 边 子 结 点 的 合并 是 标号 为 1 
的 叶子 结 点 。 当 我 们 加 入 新 的 根 结 点 x 后 , 我 们 得 到 图 12-33c 中 的 BDD, 

我 们 还 没有 完成 ,因为 图 12-33e 还 可 以 进一步 简化 。 标 号 为 y 的 结 点 的 两 个 子 结 点 都 是 结 
点 1, 因此 我 们 可 以 把 结 点 7 删除, 并 把 1 当 作 根 结 点 的 低 边 子 结 点 。 现 在 , 根 结 点 的 两 个 子 结 
点 都 是 叶子 结 点 1, 因此 我 们 可 以 消除 根 结 点 。 也 就 是 说 , 表示 这 个 合并 操作 结果 的 最 简单 的 
BDD 就 是 叶子 1 本 身 。 = 
12.7.5 在 指针 指向 分 析 中 使 用 BDD 

要 使 上 下 文 无 关 的 指针 指向 分 析 能 够 正确 工作 已 经 很 不 容易 了 。BDD 变量 的 排序 可 以 极 大 
地 影响 表示 的 大 小 。 要 得 到 一 个 能 够 使 得 分 析 很 快 结束 的 BDD 变量 排序 , 需要 各 种 各 样 的 考虑 ， 
也 包括 尝试 和 犯错 。 

使 得 上 下 文 相关 的 指针 指向 分 析 能 够 有 效 执行 是 一 件 更 加 困难 的 事情 ,因为 程序 中 有 指数 
BAW EP. PAE, 如 果 我 们 随意 使 用 编号 来 表示 一 个 调用 图 中 的 上 下 文 , 那么 我 们 其 至 不 
能 处 理 很 小 的 Java 程序 。 按 照 适 当 的 方式 对 上 下 文 进行 编号 是 很 重要 的 , 它 可 以 使 指针 指向 分 
析 中 的 编码 变 得 非常 紧凑 。 同 一 方法 的 调用 路 径 相似 的 两 个 上 下 文 之 间 有 很 多 共同 点 , 因此 对 
一 个 方法 的 nn 个 上 下 文 连续 编码 是 比较 合适 的 。 类 似 地 , 因为 同一 个 调用 点 上 的 调用 者 - 被 调 
用 者 对 之 间 具 有 很 多 相似 之 处 , 所 以 我 们 希望 对 上 下 文 进行 编码 的 方式 可 以 使 得 一 个 调用 点 上 
的 每 个 调用 者 -被 调用 者 对 之 间 的 编码 的 数值 总 是 相差 一 个 常数 。 

即使 有 了 一 个 很 合理 的 对 调用 上 下 文 编码 的 方案 , 但 高 效 地 分 析 大 型 Java 程序 仍然 困难 重 
重 。 人 们 发 现 ,主动 机 器 学 习 有 助 于 获取 较 好 的 变量 排序 , 使 得 算法 能 够 高 效 地 处 理 大 型 应 用 。 
12.7.6 12.7 节 的 练习 

练习 12. 7. 1: 使 用 例子 12.28 中 的 符号 编码 方式 , 生成 一 个 BDD 来 表示 由 元 组 (58, b), (c, 
a) 和 (b, a) 组 成 的 关系 。 你 可 以 用 任意 方式 对 布尔 变量 进行 排序 , 以 获取 最 简洁 的 BDD。 

| 练习 12. 7.2: 如 果 用 最 简洁 的 BDD 来 表示 个 变量 上 的 异 或 函数 , 那么 这 个 BDD 中 有 多 
少 个 结 点 ?把 它 表示 成 为 一 个 关于 n 的 函数 。n 个 变量 上 的 异 或 函数 是 说 如 果 这 n 个 变量 中 有 奇 
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数 个 变量 为 真 , 那么 这 个 函数 就 为 真 ; 如 果 有 偶数 个 变量 为 真 , 那么 函数 值 为 假 。 

练习 12. 7. 3: 修改 算法 12.29, 使 之 能 够 生成 两 个 BDD 的 交集 ( 即 逻 辑 AND) 。 

1! 练习 12. 7.4; 找 出 在 表示 关系 的 排序 BDD 之 上 的 进行 下 列 关 系 运算 的 算法 : 

1) 通过 投影 消除 某 些 布尔 变量 。 也 就 是 说 , 运算 得 到 的 BDD 所 表示 的 函数 如 下 : 给 定 一 个 
被 保留 变量 的 真 假 赋值 a, 如 果 存 在 被 消除 变量 的 任何 一 个 真 假 赋值 , 它 和 a 一 起 使 得 原 函 数 取 
AA, 那么 结果 函数 的 取 值 也 是 真 。 

2) 把 两 个 关系 r 和 s 连接 起 来 ,只 要 一 个 来 自 r 的 元 组 和 一 个 来 自 :的 元 组 在 r 和 的 共同 
属性 上 具有 相同 的 值 , 这 两 个 元 组 就 组 合 起 来 成 为 新 关系 的 一 个 元 组 。 实 际 上 ， 只 需要 考虑 下 面 
的 情况 就 足够 了 : 这 两 个 关系 都 只 有 两 个 分 量 , 且 它 们 有 一 个 公共 分 量 。 也 就 是 说 , 这 两 个 关系 
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过 程 间 分 析 : 对 跨越 过 程 边界 的 信息 进行 跟踪 的 数据 流 分 析 称 为 过 程 间 分 析 。 很 多 分 析 
技术 ,比如 指针 指向 分 析 , 只 有 当 它 是 过 程 间 分 析 的 时 候 才 可 以 完成 有 意义 的 分 析 工 作 。 
调用 点 : 程序 中 调用 其 他 过 程 的 程序 点 称 为 调用 点 。 在 一 个 调用 点 上 被 调用 的 过 程 可 能 
是 显然 的 。 但 是 , 如果 这 个 调用 是 通过 指针 间接 进行 的 , 或 者 它 调 用 的 是 具有 多 个 实现 
的 虚 方 法 , 那么 被 调用 的 过 程 也 可 能 是 不 明确 的 。 

调用 图 : 一 个 程序 的 调用 图 是 一 个 二 分 图 , 图 的 结 点 分 为 对 应 于 调用 点 的 结 点 和 对 应 于 
过 程 的 结 点 。 如 果 一 个 过 程 在 一 个 调用 点 上 被 调用 , 那么 就 有 一 条 从 这 个 调用 点 结 点 到 
这 个 过 程 结 点 的 边 。 

AR: 只 要 一 个 程序 中 没有 递归 ,原则 上 我 们 可 以 把 所 有 的 过 程 调用 替换 为 过 程 代码 的 
拷贝 , 并 对 得 到 的 程序 使 用 过 程 内 分 析 技 术 。 从 效果 上 看 ,这 个 分 析 是 过 程 间 分 析 。 
控制 流 相关 性 和 上 下 文 相 关 性 ; 如 果 一 个 数据 流 分 析 得 到 的 事实 和 程序 中 的 位 置 相关 ， 
那么 它 就 是 控制 流 相 关 的 。 如 果 一 个 数据 流 分 析 得 到 的 事实 和 过 程 调用 的 历史 相关 , 那 
么 它 就 是 上 下 文 相关 的 。 一 个 数据 流 分 析 可 以 是 控制 流 相关 的 、 上 下 文 相关 的 、 两 者 都 
相关 或 者 都 不 相关 。 

基于 克隆 的 上 下 文 相关 分 析 : 从 原则 上 讲 , 一 旦 我 们 建立 了 过 程 调用 的 不 同上 下 文 , 就 可 
以 想象 对 于 每 个 上 下 文 都 有 一 个 该 过 程 的 克隆 。 按 照 这 种 方法 , 一 个 上 下 文 无 关 分 析 技 
术 可 以 用 来 进行 上 下 文 相关 分 析 。 

基于 摘要 的 上 下 文 相关 分 析 : 男 一 个 过 程 间 分 析 的 方法 , 扩展 原来 为 过 程 内 分 析 而 设计 
的 基于 区 域 的 分 析 技 术 。 每 个 过 程 有 一 个 传递 函数 , 并且 在 每 一 个 调用 该 过 程 的 地 方 它 
都 被 当 作 一 个 区 域 处 理 。 

过 程 间 分 析 技 术 的 应 用 : 需要 过 程 间 分 析 技 术 的 重要 应 用 之 一 是 检测 软件 的 安全 漏洞 。 
这 些 漏 洞 的 常见 特性 是 一 个 过 程 从 某 个 不 可 信 的 输入 源 读 取 数据 , 而 男 一 个 过 程 以 可 能 
被 利用 的 方式 使 用 这 个 输入 。 

Datalog : Datalog 语言 是 if-then 规则 的 简单 表示 方式 , 它 可 以 用 于 在 高 层次 上 描述 数据 流 
分 析 。 一 组 Datalog 规则 (或 者 说 Datalog 程序 ) 可 以 使 用 多 个 标准 算法 中 的 任意 一 个 算法 
进行 求 值 。 

Datalog 规则 : 一 个 Datalog 规则 由 一 个 规则 体 ( 前 提 ) 和 和 一 个 规则 头 ( 结果) 组 成 。 规 则 体 
是 一 个 或 多 个 原子 , 而 规则 头 则 是 一 个 原子 。 原 子 就 是 作用 于 一 组 参数 的 断言 ,这 些 参 
数 的 值 可 以 是 变量 或 常量 。 规 则 体 的 多 个 原子 通过 逻辑 AND 连接 , 而 规则 体 中 的 原子 可 
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能 是 断言 的 否定 形式 。 

e IDB 和 EDB 断言 : 一 个 Datalog 程序 中 的 EDB 断言 的 真 值 事 实在 事先 给 出 。 在 一 个 数据 
流 分 析 中 ,这些 断言 对 应 于 那些 可 以 从 被 分 析 代 码 中 获取 的 事实 。IDB 断言 本 身 是 通过 
规则 定义 的 。 在 一 个 数据 流 分 析 中 , 它们 对 应 于 我 们 想 从 被 分 析 代码 中 抽取 的 信息 。 

e Datalog 程序 的 求 值 : 我 们 应 用 规则 的 方法 是 把 规则 中 的 变量 替换 为 一 些 能 够 使 该 规则 体 
取 真 值 的 常量 。 当 我 们 做 了 这 样 的 替换 后 ,就 可 以 推断 将 规则 头 中 的 变量 进行 相同 蔡 换 
后 得 到 的 断言 也 为 真 。 这 个 操作 不 断 重 复 ， 直 到 不 能 推导 出 更 多 的 事实 为 止 。 

e Datalog 程序 的 增 量 求 值 : 通过 增 量 求 值 的 方法 可 以 改进 Datalog 程序 的 求 值 效率 。 我 们 将 
进行 多 轮 求 值 。 在 每 一 轮 中 , 我 们 只 考虑 如 下 的 变量 到 常量 的 蔡 换 方 法 : 它 使 得 规则 体 
中 至 少 有 一 个 原子 是 刚刚 在 上 一 轮 中 被 发 现 的 事实 。 

e Java 指针 分 析 : 我 们 可 以 用 一 个 框架 对 Java 中 的 指针 分 析 建 模 。 在 这 个 框架 中 ,有 一些 
指向 堆 对 象 的 引用 变量 , 而 这 些 堆 对 象 中 又 有 一 些 字段 可 以 指向 其 他 堆 对 象 。 可 以 用 一 
个 Datalog 程序 写 出 一 个 上 下 文 无 关 的 指针 分 析 方 法 。 这 个 分 析 可 以 推导 出 两 种 事实 : 一 
个 变量 可 能 指向 一 个 堆 对 象 , 以 及 一 个 堆 对 象 的 字段 可 能 指向 另 一 个 堆 对 象 。 

o 使 用 类 型 信息 改进 指针 分 析 : 引用 变量 所 指向 的 堆 对 象 的 类 型 要 么 和 变量 类 型 相同 , 要 么 是 变 
量 类 型 的 子 类 型 。 如 果 我 们 能 够 利用 这 个 事实 , 我 们 就 可 以 得 到 更 加 精确 的 指针 分 析 结 果 。 

e 过 程 间 指针 分 析 : 为 了 进行 过 程 间 分 析 , 我 们 必须 增加 一 些 规 则 来 反映 参数 是 如 何 传递 的 , 返 
回 值 是 如 何 被 赋 给 变量 的 。 这 些 规则 实质 上 和 把 一 个 引用 变量 复制 到 另 一 个 引用 变量 的 规则 
相同 。 

e 寻找 调用 图 : 因为 Java 具有 虚 方 法 , 过 程 间 分 析 要 求 我 们 首先 界定 有 哪些 过 程 可 能 在 一 
个 给 定 调 用 点 上 被 调用 。 找 出 哪里 可 以 调用 哪些 程序 的 限制 的 基本 方法 是 分 析 对 象 的 类 
型 ， 并 利用 下 面 的 事实 : 一 个 虚 方法 调用 所 指向 的 实际 方法 必须 属于 适当 的 类 。 

e 上 下 文 相关 分 析 : 当 过 程 具 有 递归 特性 时 , 我 们 必须 把 调用 串 中 所 包含 的 信息 浓缩 到 有 
限 多 个 上 下 文中 。 做 这 件 事 的 有 效 方法 之 一 是 从 调用 串 中 删除 某 个 过 程 调用 与 之 相互 递 
归 调 用 的 另 一 个 过 程 (可 能 是 调用 者 本 身 ) 的 调用 点 。 使 用 这 样 的 表示 方式 ,我 们 可 以 修 
改过 程 内 指针 分 析 的 规则 , 使 断言 中 包含 上 下 文 信息 。 这 个 方法 模拟 了 基于 克隆 的 分 析 。 

o 二 分 决策 图 : BDD 是 一 种 使 用 带 根 的 DAG 表示 布尔 函数 的 简洁 方法 。 内 部 结 点 对 应 于 布 
尔 变量 , 并 且 有 两 个 子 结 点 , 即 低 子 结 点 (表示 0 值 ) 和 高 子 结 点 (表示 1 值 )。 图 中 有 标 
号 分 别 为 0 和 1 的 两 个 叶子 结 点 。 一 个 真 假 赋值 使 得 被 表示 函数 取 真 值 当 且 仅 当 从 图 的 
根 结 点 有 一 条 如 下 的 路 径 到 达 叶 子 结 点 1。 这 条 路 径 从 根 结 点 开始 , 如 果 一 个 结 点 上 的 
变量 取 值 为 0, 那么 我 们 就 走 到 低 子 结 点 , 否则 走 到 高 子 结 点 。 

e BDD 和 关系 ; 一 个 BDD 可 以 作为 Datalog 程序 中 的 断言 的 简洁 表示 方法 。 常 量 被 编码 为 
一 组 布尔 变量 的 真 假 赋值 ，BDD 表示 的 函数 为 真 当 且 仅 当 它 的 布尔 变量 表示 了 使 这 个 断 
言 取 真 值 的 事实 。 

o 使 用 BDD 实现 数据 流 分 析 : 任何 可 以 被 表示 为 Datalog 规则 的 数据 流 分 析 都 可 以 使 用 
BDD 上 的 操作 来 实现 。 这 些 BDD 表示 了 规则 所 涉及 的 断言 。 这 个 表示 方法 经 常会 得 到 
一 个 比 其 他 已 知 方法 更 加 高 效 的 实现 。 
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附录 A 一 个 完整 的 编译 器 前 端 


这 个 附录 给 出 了 一 个 完整 的 编译 器 前 端 , 它 是 基于 2.5 节 至 2.8 节 中 非 正 式 描述 的 简单 编译 
器 编写 的 。 和 第 2 章 的 主要 不 同 之 处 在 于 , 这 个 前 端 像 6. 6 节 中 描述 的 那样 为 布尔 表达 式 生成 跳 
转 代码 。 我 们 首先 给 出 源 语 言 的 语法 。 描 述 这 个 请 法 所 用 的 文法 需要 进行 调整 ， 以 适应 自 顶 向 
下 的 语法 分 析 技 术 。 

这 个 翻译 器 的 Java 代码 由 五 个 包 组 成 :main、 lexer, symbol, parser 和 inter。 包 in- 
ter 中 包含 的 类 处 理 用 抽象 语法 表示 的 语言 结构 。 因 为 语法 分 析 器 的 代码 和 其 他 各 个 包 交 互 ， 
所 以 它 将 在 最 后 描述 。 每 个 包 存 放 在 一 个 独立 的 目录 中 ,每 个 类 都 有 一 个 单独 的 文件 。 

作为 语法 分 析 器 的 输入 时 ， 源 程序 就 是 一 个 由 词法 单元 组 成 的 流 , 因此 面向 对 象 特性 和 语法 
分 析 器 的 代码 之 间 没 有 什么 关系 。 当 由 语法 分 析 器 输出 时 ,， 源 程序 就 是 一 棵 抽象 语法 树 , 树 中 的 
结构 或 结 点 被 实现 为 对 象 。 这 些 对 象 负责 处 理 下 列 工作 :构造 一 个 抽象 语法 树 结 点 、 类 型 检查 、 
生成 三 地 址 中 间 代 码 ( 见 包 inter), 


A. 1 ies 
这 个 语言 的 一 个 程序 由 一 个 块 组 成 , 该 块 中 包含 可 选 的 声明 和 语句 。 语 法 符号 basic 表示 














基本 类 型 。 
program — block 
block — { decls stmts } 
decis — decls decl | e 
decl 一 typeid ; 
type — type [num] | basic 
stmts —> simts stmt | € 
把 赋值 当 作 一 个 语句 (而 不 是 表达 式 中 的 运算 符 ) 可 以 简化 翻译 工作 。 





面向 对 象 与 面向 步骤 

在 一 个 面向 对 象 方 法 中 , 一 个 构造 的 所 有 代码 都 集中 在 这 个 与 构造 对 应 的 类 中 。 但 是 在 
面向 步骤 的 方法 中 , 这 个 方法 中 的 代码 是 按照 步骤 进行 组 织 的 , 因此 一 个 类 型 检查 过 程 中 对 
每 个 构造 都 有 一 个 case 分 支 ， 且 一 个 代码 生成 过 程 对 每 个 构造 也 都 有 一 个 case 分 支 ， 等 等 。 

对 这 两 者 进行 衡量 ,可知 使 用 面向 对 象 方法 会 使 得 改变 或 增加 一 个 构造 (比如 for 语句 ) 
变 得 较 容 易 ; 而 使 用 面向 步 双 的 方法 会 使 得 改变 或 增加 一 个 步骤 ( 比如 类 型 检查 ) 变 得 比较 容 
易 。 使 用 对 象 来 实现 时 , 增加 一 个 新 的 构造 可 以 通过 写 一 个 自 包含 的 类 来 实现 ; 但 是 如 果 要 
改变 一 个 步骤 ,比如 插 人 自动 类 型 转换 的 代码 ,就 需要 改变 所 有 受 影响 的 类 。 使 用 面向 步 又 
的 方式 时 , 增加 一 个 新 构造 可 能 会 引起 各 个 步骤 中 的 多 个 过 程 的 改变 。 








stmt — loc = bool ; 

| if ( bool) stmt 

| if ( bool) stmt else stmt 
| while ( bool) stmt 
| do stmt while ( bool) ; 
| break ; 
| block 
oy 


loc loc [ bool] | id 
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表达 式 的 产生 式 处 理 了 运算 符 的 结合 性 和 优先 级 。 它 们 对 每 个 优先 级 级 别 都 使 用 了 一 个 非 
终结 符号 , 而 非 终结 符号 factor 用 来 表示 括号 中 的 表达 式 、 标 识 符 、 数 组 引用 和 常量 。 


boo! — bool || join | join 
join — join && equality | equality 
equality 一 equality == rel | equality != rel | rel 
rel — expr < expr | expr <= expr | expr >= expr | 
expr > expr | expr 
expr — expr+ term | expr- term | term 
term —> lerm» unary | term / unary | unary 
unary — ! unary | - unary | factor 
factor — (bool) | loe | num | real | true | false 
A.2 Main 


程序 的 执行 从 类 Main 的 方法 main 开始 。 方 法 main 创建 了 一 一 个 词法 分 析 器 和 一 个 语法 分 
析 器 , 然后 调用 语法 分 析 器 中 的 方法 program, 


1) package main; // 文件 Main.java 

2) import java.io.*; import lexer.*; import parser.*; 

3) public class Main { 

4) public static void main(String{[] args) throws TOPxception { 
5) Lexer lex = new Lexer(); 

6) Parser parse = new Parser(lex); 

7) parse. program(); 

8) System. out.write(’\n’); 

9) } 

10) } 


A.3 词法 分 析 器 
包 lexer 是 2.6.5 节 中 的 词法 分 析 器 的 代码 的 扩展 。 类 Tag 定义 了 各 个 词法 单元 对 应 的 


1) package lexer; // 文件 Tag.java 

2) public class Tag { 

3) public final static int 

4) AND = 256, BASIC = 257, BREAK = 258, DO = 259, ELSE = 260, 
5) EQ = 261, FALSE = 262, GE = 263, ID = 264, IF = 265, 
6) INDEX = 266, LE = 267, MINUS = 268, NE = 269, NUM = 270, 
7) OR = 271, REAL = 272, TEMP = 273, TRUE = 274, WHILE = 275; 


8) } 
甚 中 的 三 个 常量 INDEX, MINUS 和 TEMP 不 是 词法 单元 ,它们 将 在 抽象 语法 树 中 使 用 。 
类 Token 和 Num 和 2. 6.5 节 的 相同 , 但 是 增加 了 方法 toString: 


1) package lexer; // 文件 Token.java 

2) public class Token { 

3 public final int tag; 

4 public Token(int t) { tag = t; } 

5 public String toString() {return "" + (char)tag;} 
6) } 


1) package lexer; // 文 件 ~Num.java 

2) public class Num extends Token { 

3 public final int value; 

4 public Num(int v) { super(Tag.NUM); value = v; } 
5 public String toString() { return "" + value; } 
6 





3) } 
类 Word 用 于 管理 保留 字 、 标 识 符 和 像 && 这 样 的 复合 词法 单元 的 词素 。 它 也 可 以 用 来 管理 在 中 
间 代 码 中 运算 符 的 书写 形式 ; 比如 单 目 减 号 。 例 如 , 源 文本 中 的 -2 的 中 间 形 式 是 minus 2, 
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1) package lexer; // 文件 Word.java 

2) public class Word extends Token { 

3) public String lexeme = ""; 

4) public Word(String s, int tag) { super(tag); lexeme = s; } 
5) public String toString() { return lexeme; } 

6) public static final Word 


7) and = new Word( "&&", Tag.AND ), or = new Word( "||", Tag.OR ), 
8) eq = new Word( "==", Tag.EQ ), ne = new Word( "!=", Tag.NE ), 
9) le = new Word( "<=", Tag.LE ), ge = new Word( ">=", Tag.GE ), 
10) minus = new Word( "minus", Tag.MINUS ), 
11) True = new Word( "true", Tag.TRUE ), 
12) False = new Word( "false", Tag.FALSE ), 
13) temp = new Word( "t", Tag.TEMP ); 
14) } 

类 Real 用 于 处 理 浮 点 数 : 
1) package lexer; // 文件 Real.java 


2) public class Real extends Token { 

3) public final float value; 

4) public Real(float v) { super(Tag.REAL); value = v; } 

5) public String toString() { return "" + value; } 

6) } 
如 我 们 在 2. 6. 5 节 中 讨论 的 , 类 Lexer 的 主 方法 , 即 函 数 scan, 识别 数字 、 标 识 符 和 保留 字 。 

类 Lexer 中 的 第 9 ~ 13 行 保留 了 选 定 的 关键 字 。 第 14 ~ 16 行 保留 了 在 其 他 地 方 定义 的 对 象 
Hi. WR word. True 和 Word. False 在 类 Word 中 定义 。 对 应 于 基本 类 型 int char, 


bool 和 float 的 对 象 在 类 Type 中 定义 。 类 Type 是 WorG 的 一 个 子 类 。 类 Type 来 自 包 sym- 


bols, 


1) package lexer; // 3 Lexer.java 

2) import java.io.*; import java.util.*; import symbols.*; 
3) public class Lexer { 

4) public static int line = 1; 

5) char peek = ’ ’; 

6) Hashtable words = new Hashtable(); 


7) void reserve(Word w) { words.put(w.lexeme, w); } 
8) public Lexer() { 

9) reserve( new Word("if", Tag.IF) ) ; 

I0) reserve( new Word("else", Tag.ELSE) ); 

11) reserve( new Word("“while", Tag.WHILE) ); 

12) reserve( new Word("do", Tag .DO) ); 

13) reserve( new Word("break", Tag.BREAK) ); 

14) reserve( Word.True ); reserve( Word.False ); 
15) reserve( Type.Int ); reserve( Type.Char ); 
16) reserve( Type.Bool ); reserve( Type.Float ); 
17) } 


函数 readch( ) (98 18 行 ) 用 于 把 下 一 个 输入 字符 读 到 变量 peek 中 。 名 字 readch 被 复 用 或 重 
载 , (第 19 ~24 47), 以 便 帮 助 识 别 复 合 的 词法 单元 。 比 如 , 一 看 到 输入 字符 < , 调用 readch 
(" = ") 就 会 把 下 一 个 字符 读 人 peek, 并 检查 它 是 否 为 = 。 


18) void readch() throws IOException { peek = (char)System.in.read(); } 
19) boolean readch(char c) throws I0Exception { 


20) readch(); 

21) if( peek != c ) return false; 
22) peek = ?; 

23) return true; 

24) ¥ 


函数 scan 一 开始 首先 略 过 所 有 的 空白 字符 (第 26 ~30 行 )。 它 首先 试图 识别 像 < = 这 样 的 复合 
词法 单元 (第 31 ~34 行 ) 和 像 365 及 3. 14 这 样 的 数字 (第 45 ~ 58 行 )。 如 果 不 成 功 , 它 就 试图 读 
人 一 个 字符 串 ( 第 59 ~70 行 )。 
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25) public Token scan() throws I0Exception { 
26) for( ; ; readch() ) { 
27) if( peek == > ? || peek == *\t’ ) continue; 
28) else if( peek == ’\n’ ) line = line + 1; 
29) else break; 
30) } 
31) switch( peek ) { 
32) case ?&?: 
33) if( readch(’&’) ) return Word.and; else return new Token(’&’); 
34) case '|’: f 
35 if( readch(? |?) ) return Word.or; else return new Token(’|’); 
36) case =’: 
37) if( readch(’=’) ) return Word.eq; else return new Token(’=’); 
38) case ’!?; 
39) if( readch(’=’) ) return Word.ne; else return new Token(’!’); 
40) case *<?: 
41) if( readch(’=’) ) return Word.1le; else return new Token(’<’); 
42) case ?> 
43) if( readch(’=’) ) return Word.ge; else return new Token(’>’); 
44) } 
45) if( Character.isDigit(peek) ) { 
46) int v = 0; 
47) do { 
48) v = 10*v + Character.digit(peek, 10); readch(); 
49) } while( Character.isDigit(peek) ); 
50) if( peek t= ’.’ ) return new Num(v); 
51) float x = v; float d = 10; 
52) for(;;) { 
53) readch(); 
54) if( ! Character.isDigit(peek) ) break; 
55 x = x + Character.digit(peek, 10) / d; d = d*10; 
56) } 
57) return new Real(x); 
58) } 
59) if( Character.isLetter(peek) ) { 
60) StringBuffer b = new StringBuffer(); 
61) do { 
62) b.append(peek); readch(); 
63) } while( Character.isLetter0rDigit (peek) ); 
64) String s = b.toString(); 
65) Word w = (Word)words.get(s); 
66) if( w != null ) return w; 
67) w = new Word(s, Tag.ID); 
68) words.put(s, w); 
69) return vW; 
70) } 
最 后 , peek 中 的 任意 字符 都 被 作为 词法 单元 返回 (第 71~72 行 )。 
71) Token tok = new Token(peek); peek =’ °; 
72) return tok; 
73) } 
74)} 


A.4 符号 表 和 类 型 

包 symbols 实现 了 符号 表 和 类 型 。 

类 Env 实质 上 和 图 2-37 中 的 代码 一 样 。 类 Lexer HUSA BIS, 类 Env 把 字符 串 词 
法 单元 映射 为 类 Ia 的 对 象 。 类 Ia 和 其 他 的 对 应 于 表达 式 和 语句 的 类 一 起 都 在 包 inter 中 
定义 。 








1) package symbols; // 文件 Envy.java 

2) import java.util.*; import lexer.*; import inter. *; 

3) public class Env { 

4 private Hashtable table; 

5 protected Env prev; 

6 public Env(Env n) { table = new Hashtable(); prev = n; } 
7) public void put(Token w, Id i) { table.put(w, i); } 
8 public Id get(Token w) { 

9) for( Env e = this; e != null; e = e.prev ) { 

10) Id found = (Id)(e.table.get(w)); 

11) if( found != null ) return found; 

12 + 

13) return null; 

14 } 

15) } 


我 们 把 类 Type 定义 为 类 word HFA, 因为 像 int 这 样 的 基本 类 型 名 字 就 是 保留 字 , 将 被 
词法 分 析 器 从 词素 映射 为 适当 的 对 象 。 对 应 于 基本 类 型 的 对 象 是 Type. Int、Type.Float、 


. Type. 


Char 和 Type.Bool( 第 7~10 行 )。 这 些 对 象 从 超 类 中 继承 了 字段 tag, 相应 的 值 被 设 


置 为 Tag. BASIC, 因此 语法 分 析 器 以 同样 的 方式 处 理 它们 。 


4 
5 
6 
7 
8 
9 
10 


package symbols; // 文件 Type.java 

import lexer.*; 

) public class Type extends Word { 

) public int width = 0; //width 用 于 存储 分 配 

public Type(String s, int tag, int w) { super(s, tag); width = w; } 
public static final Type 





) Int = new Type( "int", Tag.BASIC, 4 ), 
Float = new Type( “float", Tag.BASIC, 8 ), 
) Char = new Type( "char", Tag-BASIC, 1), 
Bool = new Type( "bool", Tag.BASIC, 1 ); 


函数 numeric( $% 11 ~14 行 ) 和 max( 第 15 ~ 20 行 ) 可 用 于 类 型 转换 。 


11 public static boolean numeric(Type p) { 

12) if (p == Type.Char || p == Type.Int || p == Type.Float) return true; 
13 else return false; 

14 } 

15 public static Type max(Type pl, Type p2 ) { 

16) if ( ! numeric(pi) |l ! numeric(p2) ) return null; 

17 else if ( pi == Type.Float |] p2 == Type.Float ) return Type.Float; 
18) else if ( pi == Type.Int || p2 == Type.Int  ) return Type.Int; 
19) else return Type.Char; 

20 } 

21) } 





在 两 个 “数字 ”类 型 之 间 允 许 进 行 类 型 转换 ,“ 数 字 ” 类 型 包括 Type. Char, Type. Int 和 


Type. 


Float 。 当 一 个 算术 运算 符 应 用 于 两 个 数字 类 型 时 , 结果 类 型 是 这 两 个 类 型 的 “max” 


o 


数组 是 这 个 源 语 言 中 唯一 的 构造 类 型 。 在 第 7 行 中 调用 super 设置 字段 wiath 的 值 。 这 个 


值 在 计算 地 址 时 是 必 不 可 少 的 。 它 





同时 也 把 lexeme 和 tok 设置 为 默认 值 , 这些 值 没有 被 使 用 。 





1) package symbols; // 文件 Array.java 

2) import lexer.*; 

3) public class Array extends Type { 

4 public Type of; // 数组 的 元 素 类 型 

5 public int size = 1; // 元 素 个 数 

6) public Array(int sz, Type p) { 

7 super("[]", Tag. INDEX, sz¥p.width); size = sz; of = p; 

8 } 

9 public String toString() { return "[" + size + "] " + of.toString(); } 


10) } 
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A.5 表达 式 的 中 间 代 码 


包 inter 包含 了 Node 的 类 层次 结构 。Node 有 两 个 子 类 :对 应 于 表达 式 结 点 的 Expr 和 对 
应 于 语句 结 点 的 Stmt 。 本 节 介 绍 Expr MEM FA. Expr 的 某 些 方法 处 理 布尔 表达 式 和 跳 转 
代码 , 这些 方 法 和 Expr 的 其 他 子 类 将 在 A. 6 节 中 讨论 。 

抽象 语法 树 中 的 结 点 被 实现 为 类 Node 的 对 象 。 为 了 报告 错误 , 字段 Lexline (文件 
Node. java 的 第 4 行 ) 保 存 了 本 结 点 对 应 的 构造 在 源 程序 中 的 行 号 。 第 7 ~ 10 行 用 来 生成 三 地 
址 代码 。 

1) package inter; // 文件 Node.java 

2) import lexer.*; 

3) public class Node { 

4) int lexline = 0; 

5) Node() { lexline = Lexer.line; } 

6) void error(String s) { throw new Error("near line "“+lexlinet+": "+s); } 

7) static int labels = 0; 

8) public int newlabel() { return ++labels; } 


9) public void emitlabel(int i) { System.out.print("L" + i+ ":"); } 
10) public void emit(String s) { System.out.println("\t" + s); } 
11):} : 


表达 式 构 造 被 实现 为 Expr 的 子 类 。 类 Expr 包含 字段 op 和 type( 文 件 Expr. java 的 第 
4 ~5 行 ), 分 别 表 示 了 一 个 结 点 上 的 运算 符 和 类 型 。 


1) package inter; // 文件 Expr.java 

2) import lexer.*; import symbols.*; 

3) public class Expr extends Node { 

4) public Token op; 

5) public Type type; 

6) Expr(Token tok, Type p) { op = tok; type = p; } 


方法 gen( 第 7 行 ) 返 回 了 一 个 “项 ”, 该 项 可 以 成 为 一 个 三 地 址 指令 的 右 部 。 给 定 一 个 表达 
KE =E +E, 方法 gen 返回 一 个 项 Xy +X, 其 中 xy All x2 分 别 是 存放 E, Al Ey 值 的 地 址 。 如 果 
这 个 对 象 是 一 个 地 址 , 就 可 以 返回 this 值 。Expr 的 子 类 通常 会 重新 实现 gen。 

方法 reduce( 第 8 行 ) 把 一 个 表达 式 计算 (或 者 说 “ 归 约 ” ) 成 为 一 个 单一 的 地 址 。 也 就 是 说 ， 
它 返 回 一 个 常量 、 一 个 标识 符 , 或 者 一 个 临时 名 字 。 给 定 一 个 表达 式 , 方法 reduce 返回 一 个 
存放 五 的 值 的 临时 变量 to 如果 这 个 对 象 是 一 个 地 址 , 那么 this 仍然 是 正确 的 返回 值 。 

我 们 把 对 方法 jumping 和 emitjumps( 第 9~18 行 ) 的 讨论 推迟 到 A.6 节 中 进行 ,它们 为 
布尔 表达 式 生成 跳 转 代码 。 | 


7 public Expr gen() { return this; } 

8 public Expr reduce() { return this; } 

9 public void jumping(int t, int f) { emitjumps(toString(), t, f); } 
10 public void emitjumps(String test, int t, int f) { 

11 if( t !=0&&g f !=0){ 

12 emit("if " + test + " goto L" + t); 

13) emit("goto L" + f); 

14 } 

15) else if( t '= 0 ) emit("if " + test + " goto L" + t); 

16 else if( f != 0 ) emit("iffalse "+ test + " goto L" + f); 
17 else ; // FERIS, AA t ts shake 

18 } 

19 public String toString() { return op.toString(); } 

20) } 





因为 一 个 标识 符 就 是 一 个 地 址 , 类 Id 从 类 Expr 中 继承 了 gen 和 reduce 的 默认 实现 。 
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1) package inter; // 文件 Id.java 

2) import lexer.*; import symbols.*; 

3) public class Id extends Expr { 

4) public int offset; // 相对 地 赴 

5) public Id(Word id, Type p, int b) { super(id, p); offset = b; } 
6) } 


对 应 于 一 个 标识 符 的 类 Id 的 结 点 是 一 个 叶子 结 点 。 函 数 调用 super(id,p) (XH Id. java 的 第 
5 47) 98 id Al p 分 别 保存 在 继承 得 到 的 字段 op Ml type 中。 字段 offset (第 4 行 ) 保 存 了 这 个 
标识 符 的 相对 地 址 。 

类 Op HET reduce 的 一 个 实现 (文件 Op. java 的 第 5 ~ 10 行 )。 这 个 类 的 子 类 包括 :表示 
算术 运算 符 的 子 类 Arith， 表 示 单 日 运算 符 的 子 类 Unary 和 表示 数组 访问 的 子 类 Access。 这 
些 子 类 都 继承 了 这 个 实现 。 在 每 种 情况 下 ,， reduce 调用 gen 来 生成 一 个 项 , 生成 一 个 指令 把 这 
个 项 赋值 给 一 个 新 的 临时 名 字 , 并 返回 这 个 临时 名 字 。 





1) package inter; // 文件 Op.java 

2) import lexer.*; import symbols.*; 

3) public class Op extends Expr { 

4) public Op(Token tok, Type p) { super(tok, p); } 
5 public Expr reduce() { 

6 Expr x = gen(); 

7 Temp t = new Temp(type); 

8) emit( t.toString() + "= " + x,toString() ); 
9) return t; 

10 } 

11) } 





类 arith 实现 了 双 目 运算 符 , 比如 + 和 * 。 构 造 函 数 Arith 首先 调用 super(tok,null) (#6 
ÍT), 其 中 tok 是 一 个 表示 该 运算 符 的 词法 单元 , nul1 是 类 型 的 占 位 符 。 相 应 的 类 型 在 第 7 行使 用 函 
数 Type. max 来 确定 , 这 个 函数 检查 两 个 运算 分 量 是 否 可 以 被 类 型 强制 为 一 个 常见 的 数字 类 型 ; 
Type.max 的 代码 在 A. 4 节 中 给 出 。 如 果 它 们 能 够 进行 自动 类 型 转换 , type 就 被 设置 为 结果 类 型 ; T 
则 就 报告 一 个 类 型 错误 (第 8 行 ) 。 这 个 简单 编译 器 检查 类 型 , 但 是 它 并 不 插入 类 型 转换 代码 。 


1) package inter; // 文件 Arith java 
import lexer.*; import symbols.*; 

3) public class Arith extends Op { 

4) public Expr expri, expr2; 


v 


5 public Arith(Token tok, Expr x1, Expr x2) { 





bt 





6 super(tok, null); expri = x1; expr2 = x2; 

7) type = Type.max(expri.type, expr2.type); 

8 if (type == null ) error("type error"); 

9) } 

10 public Expr gen() { 

11) return new Arith(op, expri.reduce(), expr2.reduce()); 
12) } 

13) public String toString() { 

14) return expri.toString()+" "“top.toString()+" “+texpr2.toString(); 
15) } 

16) } 


方法 gen 把 表达 式 的 子 表达 式 归 约 为 地 址 ,并 将 表达 式 的 运算 符 作 用 于 这 些 地 址 (文件 
Arith. java 的 第 11 行 ) ,从 而 构造 出 了 一 个 三 地 址 指令 的 右 部 。 比 如 , 假设 gen 在 a+bx*c 的 根 
部 被 调用 。 其 中 对 reduce 的 调用 返回 a 作为 子 表达 式 a 的 地 址 , 并 返回 写作 为 b*c 的 地 址 。 
EI, reduce 还 生成 指令 t =b*c。 方法 gen 返回 了 一 个 新 的 Arith 结 点 , 其 中 的 运算 符 是 
* ， 而 运算 分 量 是 地 址 a Alt © 


O 为 了 报告 错误 ,在 构造 一 个 结 点 时 ,类 Node 中 的 字段 lexline 记录 了 当前 的 文本 行 号 。 我 们 把 在 中 间 代 码 生 成 
过 程 中 构造 新 的 结 点 时 跟踪 行 号 的 任务 留 给 读者 。 
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值得 注意 的 是 ， 和 所 有 其 他 表达 式 一 样 , 临时 名 字 也 有 类 型 。 因 此 , 构造 函数 Temp 被 调用 
时 有 一 个 类 型 参数 (文件 Temp. java 的 第 6 行 ) .9 


1) package inter; // 文件 Temp.java 
2) import lexer.*; import symbols.#; 
3) public class Temp extends Expr { 
4) static int count = 0; 

5) int number = 0; 

6) public Temp(Type p) { super(Word.temp, p); number = ++count; } 
7) public String toString() { return "t" + number; } 


8) } 
类 Unary 和 类 arith 对 应 , 但 是 处 理 的 是 单 目 运算 符 : 
1) package inter; // 文件 Unary.java 


2) import lexer.*; import symbols.*; 

3) public class Unary extends Op { 

4) public Expr expr; 

5) public Unary(Token tok, Expr x) { // 处 理 单 目 减 法 ， 对 ! 的 处 理 见 Not 


6) super(tok, null); expr = x; 

7) type = Type.max(Type.Int, expr.type); 
8) if (type == null ) error("type error"); 
9) } 


10) public Expr gen() { return new Unary(op, expr.reduce()); } 
11) public String toString() { return op.toString()+" "+expr.toString(); } 


A.6 布尔 表达 式 的 跳 转 代码 


布尔 表达 式 B 的 跳 转 代码 由 方法 jumping 生成 。 这 个 方法 的 参数 是 两 个 标号 t ME, 它们 
分 别称 为 表达 式 B 的 true H OA false HO. WR B 的 值 为 真 , 代码 中 就 包含 一 个 目标 为 上 的 跳 
转 指 令 ; WR 8 的 值 为 假 , 就 有 一 个 目标 为 £ 的 指令 。 按 照 惯例 , 特殊 标号 0 表示 控制 流 从 8 F 
R, DTK B 的 代码 之 后 的 下 一 个 指令 。 

我 们 从 类 Constant Fih. B 417 LRE RR Constant 的 参数 是 一 个 词法 单元 tok 和 
一 个 类 型 p。 它 在 抽象 语法 树 中 构造 出 一 个 标号 为 tok、 类 型 为 p 的 叶子 结 点 。 为 方便 起 见 , 构 
ie PAY Constant 被 重 载 (第 5 行 ), 重 载 后 的 构造 函数 可 以 根据 一 个 整数 创建 一 个 常量 对 象 。 

1) package inter; // 文件 Constant.java 

2) import lexer.*; import symbols.*; 

3) public class Constant extends Expr { 

4) public Constant(Token tok, Type p) { super(tok, p); } 


5) public Constant(int i) { super(new Num(i), Type.Int); 了 
6) public static final Constant 


7) True = new Constant(Word.True, Type.Bool), 

8) False = new Constant(Word.False, Type.Bool); 

9) public void jumping(int t, int f) { 

10) if ( this == True gg t != 0 ) emit("goto L" + t); 

11) else if ( this == False && f '= 0) emit("goto L" + f); 
12) } 

13) } 


方法 jumping( 文 件 Constant. java 的 第 9 ~12 行 ) 有 两 个 参数 ; 标号 为 t 和 ff。 如 果 这 个 常量 是 
静态 对 象 True( 在 第 7 行 中 定义 ) , t 不 是 特殊 标号 0, 那么 就 会 生成 一 个 目标 为 上 的 跳 转 指令 。 否 
WU, 如 果 这 是 对 象 False( 在 第 8 THEM) A £F, 那么 就 会 生成 一 个 目标 为 £ 的 跳 转 指令 。 





O 另 一 种 可 行 的 方法 是 让 这 个 构造 函数 以 一 个 表达 式 结 点 作为 参数 ,这 样 它 就 可 以 复制 这 个 表达 式 结 点 的 类 型 和 文 


本 位 置 。 


一 个 完整 的 编译 器 前 端 619 





类 Logical 为 类 Or And 和 Not 提供 了 一 些 常见 功能 。 字 段 expri 和 expr2 (HS 4 FF) sf 
应 于 一 个 逻辑 运算 符 的 运算 分 量 ( 虽然 类 Not 实现 了 一 个 单 目 运算 符 ， 为 方便 起 见 ,， 我 们 还 是 把 
它 当 作 Logical ANF AE). HERK Fogical(cok,a,b)( 第 5~10 行 ) 构 造 出 了 一 个 语法 树 的 
结 点 , 其 运算 符 为 tok, 而 运算 分 量 为 a Mb. EZRA TME, EVAL RAR check 来 保证 a 
和 b 都 是 布尔 类 型 。 方 法 gen 将 会 在 本 节 的 最 后 讨论 。 


1) Package inter; // 文件 Logical.java 
2) import lexer.*; import symbols.*; 





3) public class Logical extends Expr { 

4 public Expr expri, expr2; 

5 Logi¢al(Token tok, Expr x1, Expr x2) { 

6 super(tok, null); // 开始 时 类 型 设置 为 空 
7) expri = xi; expr2 = x2; 

8 type = check(expri.type, expr2.type); 

9) if (type == null ) error("type error"); 

10 } 

11 public Type check(Type pi, Type p2) { 

12 if ( pi == Type.Bool && p2 == Type.Bool ) return Type.Bool; 
13 else return null; 

14 了 

15 public Expr gen() { 

16 int f = newlabel(); int a = newlabel(); 

17 Temp temp = new Temp(type); 

18 this. jumping(0,f); 

19 emit (temp.toString() + " = true"); 

20 emit ("goto L" + a); 

21) emitlabel(f); emit(temp.toString() + " = false"); 

22) emitlabel(a); 

23) return temp; 

24) } 

25) public String toString() { 

26) return expri.toString()+" "“+top.toString()+" "+expr2.toString(); 
27) } 

28) } 





在 类 Or 中 , 方法 jumping (HH 5 ~ 10 行 ) 生 成 了 一 个 布尔 表达 式 B = Bi || B, 的 跳 转 代码 。 
当前 假设 中 的 true HO t 和 false 出 口 £ 都 不 是 特殊 标号 0。 因 为 如 果 B AB, 有 必然 为 真 ， 所 
以 Bi 的 tre 出口 必然 是 t, MEK false 出 口 对 应 于 B: 的 第 一 条 指令 。B, 的 true 和 false 出 口 和 
B 的 相应 出 口 相 同 。 


1) package inter; // 文件 Or.java 

2) import lexer.*; import symbols.*; 

3) public class Or extends Logical { 

4 public Or(Token tok, Expr x1, Expr x2) { super(tok, x1, x2); } 
5 public void jumping(int t, int f) { 

6 int label = t != 0 ? t : newlabel(Q); 

7 expri.jumping(label, 0); 

8 expr2.jumping(t,f); 

9 if( t == 0 ) emitlabel(label) ; 





10) } 
11)} 


在 一 般 情 况 下 , 8 的 true 出 口上 可 能 是 特殊 标号 0。 变量 Label (文件 Or. java 的 第 6 行 ) 
保证 了 B, 的 true 出 口 被 正确 地 设置 为 8 的 代码 的 结尾 处 。 如 果 t 为 0, 那么 label 被 设置 为 一 
个 新 的 标号 , 并 在 By 和 By 的 代码 被 生成 后 再 生成 这 个 新 标号 。 

类 And 的 代码 和 Or 的 代码 类 似 。 


1) package inter; // 文件 And.java 
2) import lexer.*; import symbols.*; 
3) public class And extends Logical { 
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public And(Token tok, Expr xi, Expr x2) { super(tok, xi, x2); } 
public void jumping(int t, int f) { 

int label = f != 0 ? f : newlabel(); 

expri.jumping(0, label); 

expr2.jumping(t,f) ; 

if( f == 0 ) emitlabel(label); 


— Ow ON AU È 
NNN ee 


— 


} 

虽然 类 Not 实现 的 是 一 个 单 目 运算 符 , 这 个 类 和 其 他 布尔 运算 符 之 间 仍 然 具 有 相当 多 的 共同 之 
Ab, 因此 我 们 把 它 作 为 Logical 的 一 个 子 类 。 它 的 超 类 具有 两 个 运算 分 量 , 因此 在 第 4 行 对 super 
的 调用 中 x2 出 现 了 两 次 。 在 第 5 ~6 行 的 方法 中 , 只 有 expr2( 文 件 Logical. java 的 第 4 行 上 声 
明 ) 被 用 到 。 在 第 5 行 , 方法 jumping 仅仅 把 true HOR false 出 口 对 调 , 调用 expr2. jumping, 


1) package inter; // 文件 Not.java 

) import lexer.*; import symbols.*; 

) public class Not extends Logical { 

) public Not(Token tok, Expr x2) { super(tok, x2, x2); } 

) public void jumping(int t, int f) { expr2.jumping(f, t); } 

) public String toString() { return op.toString()+" "+expr2.toString(); } 
) 


类 Rel 实现 了 运算 符 <、< =、= =、! =, > =H] >., RM check( 第 5~9 行 ) 检 查 两 个 
运算 分 量 是 否 具 有 相同 的 类 型 , 但 它们 不 是 数组 类 型 。 为 简单 起 见 , 这 里 不 允许 类 型 强制 转换 。 


t) package inter; // 文件 Rel.java 

2) import lexer.*; import symbols.*; 

3) public class Rel extends Logical { 

4) public Rel(Token tok, Expr xi, Expr x2) { super(tok, xi, x2); } 
5) public Type check(Type pil, Type p2) { 

6) if ( pl instanceof Array || p2 instanceof Array ) return null; 
7) else if( pi == p2 ) return Type.Bool; 

8) else return null; 

9) } 
10) public void jumping(int t, int f) { 
11) Expr a = expri.reduce(); 

12) Expr b = expr2.reduce() ; 
13) 
String test = a.toString() + " " + op.toString() + " " + b.toString(); 


emitjumps(test, t, f); 


方法 jumping( 文件 Rel. java 的 第 10 ~ 15 行 ) 首 先 为 子 表 达 式 exprl 和 expr2 生成 代码 (第 
11 ~12 行 )。 然 后 它 调用 方法 emitjumps, 这 个 方法 在 A.5 节 的 文件 Expr. java 中 的 第 10 ~ 18 
行 中 定义 。 如 果 t 和 f 都 不 是 特殊 标号 0, 那么 emitjumps 执行 下 列 代码 : 


12) emit("if " + test + " goto L" + t); // 文件 Exprjava 

13) emit("goto L" + f); 

如 果 上 或 上 是 特殊 标号 0, 那么 最 多 只 会 生成 一 个 指令 ( 同样 是 来 自 文件 Expr java) : 
15) else if( t != 0 ) emit("if "+ test + " goto L" + t); 

16) else if( f != 0 ) emit("iffalse " + test + " goto L" + f); 

17) else ; // 不 后 成 指令 ， 因 为 +t 和 了 都 直接 穿越 


在 生成 类 Access 的 代码 时 演示 了 方法 emitjumps 的 另 一 种 用 法 。 源 语言 允许 把 布尔 值 赋 
给 标识 符 和 数组 元 素 , 因此 一 个 布尔 表达 式 可 能 是 一 个 数组 访问 。 类 Access 有 一 个 方法 gen， 
用 来 生成 “正常 "代码 , 男 一 个 方法 jumping 用 来 生成 跳 转 代码 。 方 法 jumping( 第 11 行 ) 在 把 
这 个 数组 访问 妇 约 为 一 个 临时 变量 后 调用 emitjumps。 这 个 类 的 构造 函数 (第 6 ~9 行 ) 被 调用 
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时 的 参数 为 一 个 平坦 化 的 数组 a、 一 个 下 标 i 和 该 数组 的 元 素 类 型 p。 在 生成 数组 地 址 计算 代码 
的 过 程 中 完成 了 类 型 检查 。 

1) package inter; /1 文件 Access.java 

2) import lexer.*; import symbols.*, 

3) public class Access extends Op { 

4 public Id array; 

5) public Expr index; 

6 public Access(Id a, Expr i, Type p) { // p 是 将 数组 平坦 化 后 的 元 素 类 型 





7) super(new Word("[]", Tag.INDEX), p); 

8) array = a; index = i; 

9 } 

10 public Expr gen() { return new Access(array, index.reduce(), type); } 

11 public void jumping(int t,int f) { emitjumps(reduce().toString(),t,f); } 
12) public String toString() { . 

13) return array.toString() + " [ " + index.toString() + " J"; 

14) } 

15) } 


跳 转 代码 还 可 以 被 用 来 返回 一 个 布尔 值 。 本 节 中 较 早 描述 的 类 Logical 有 一 个 方法 gen 
(第 15 ~24 行 )。 这 个 方法 返回 一 个 临时 变量 temp。 这 个 变量 的 值 由 这 个 表达 式 的 跳 转 代码 中 
的 控制 流 决定 。 在 这 个 布尔 表达 式 的 true HO, temp 被 赋予 true 值 ; 7 false HEO, temp 被 赋 
F false 值 。 这 个 临时 变量 在 第 17 行 声明 。 这 个 表达 式 的 跳 转 代码 在 第 18 行 生成 , 其 中 的 true 
出 口 是 下 一 条 指令 , 而 false 出 口 是 一 个 新 标号 £。 下 一 条 指令 把 true (AIA temp (第 19 fF), 
后 面 紧 跟 目标 为 新 标号 a 的 跳 转 指令 (第 20 行 )。 第 21 行 上 的 代码 生成 标号 f 和 一 个 把 false 
赋 给 temp 的 指令 。 这 个 代码 片段 的 结尾 是 标号 a, 该 标号 在 第 22 行 生成 。 最 后 ,geu 返回 tenp 
(第 23 行 )。 


A.7 语句 的 中 间 代 码 


每 个 语句 构造 被 实现 为 Stmt 的 一 个 子 类 。 一 个 构造 的 组 成 部 分 对 应 的 字段 是 相应 子 类 的 
对 象 。 例 如 ， 如 我 们 将 看 到 的 , 类 while 有 一 个 对 应 于 测试 表达 式 的 字段 和 一 个 子 语句 字段 。 

下 面 的 类 stmt 的 代码 中 的 第 3 ~4 行 处 理 抽象 语法 树 的 构造 。 构 造 函 数 Stmt ( ) 不 做 任何 
事情 , 因为 相关 处 理工 作 是 在 子 类 中 完成 的 。 静 态 对 象 Stmt .Null( 第 4 行 ) 表 示 一 个 空 的 语句 
序列 。 








1) package inter; // 文件 Stmt.java 

2) public class Stmt extends Node { 

3) public Stmt() { } 

4) public static Stmt Null = new Stmt(); 

5) public void gen(int b, int a) {} // 调用 时 的 参数 是 语句 开始 处 的 标号 和 语句 的 下 一 条 指令 的 标号 

6) int after = 0; // 保存 语句 的 下 一 条 指令 的 标号 

public static Stmt Enclosing = Stmt.Null; // 用 于 break 语句 

8 

第 5 -7 行 处 理 三 地 址 代码 的 生成 。 方 法 gen 被 调用 时 两 个 参数 分 别 是 标号 a Mb, 其 中 
标记 这 个 语句 的 代码 的 开始 处 ,而 a 标记 这 个 语句 的 代码 之 后 的 第 一 条 指令 。 方法 gen( 第 5 
行 ) 是 子 类 中 的 gen 方法 的 占 位 符 。 子 类 While 和 Do 把 它们 的 标号 a 存放 在 字段 after( 第 6 
行 ) 中 。 当 任何 肉 层 的 break 语句 要 跳出 这 个 外 层 构 造 时 就 可 以 使 用 这 些 标 号 。 对 象 St- 
mt. Enclosing 在 语法 分 析 时 被 用 于 跟踪 外 层 构造 。( 对 于 包含 continue 语句 的 源 语言 ,我 
们 可 以 使 用 同样 的 方法 来 跟踪 一 个 continue 语句 的 外 层 构造 。) 

类 If 的 构造 函数 为 语句 站 ( E ) 5 构造 一 个 结 点 。 字 段 expr 和 stmt 分 别 保存 了 E 和 5 对 
应 的 结 点 。 请 注意 , 小 写字 母 组 成 的 expr 是 一 个 类 Expr 的 字段 的 名 字 。 类 似 地 , stmt 是 类 为 
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stmt 的 字段 的 名 字 。 
1) package inter; // 文件 If java 
2) import symbols. *; 
3) public class If extends Stmt { 
4) Expr expr; Stmt stmt; 
5) public If(Expr x, Stmt s) { 
6) expr = x; stmt = s; 
7) 


if( expr.type != Type.Bool ) expr.error("boolean required in if"); 
8) } 
9) public void gen(int b, int a) { 
10) int label = newlabel(); // stmt 的 代码 的 标号 
11) expr.jumping(0, a); // 为 真 时 控制 流 穿越 ， 为 假 时 转向 a 
12) emitlabel(label); stmt.gen(label, a); 
13) J 
14) } 


一 个 If 对 象 的 代码 包含 了 expr 的 跳 转 代码 , 然后 是 stmt 的 代码 。 如 A.6 节 中 所 讨论 的 ， 
第 11 行 的 调用 expr. jumping(0,a) 指 明 如 果 expr 的 值 为 真 , 控制 流 必须 穿越 expr 的 代码 ; 
否则 控制 流 必须 转向 标号 a。 

类 Else 处 理 条 件 语 句 的 else 部 分 。 它 的 实现 和 类 IE 的 实现 类 似 : 


1) package inter; // 文件 Else.java 
2) import symbols.*; 

3) public class Else extends Stmt { 

4) Expr expr; Stmt stmti, stmt2; 

5) public Else(Expr x, Stmt si, Stmt s2) { 


6) expr = x; stmti = si; stmt2 = s2; 

7) if( expr.type != Type.Bool ) expr.error("boolean required in if"); 
8) } 

9) public void gen(int b, int a) { 

10) int labeli = newlabel(); // labeli 用 于 语句 stmt1 

11) int label2 = newlabel(); // label2 用 于 语句 stmt2 

12) expr. jumping(0,label2); // 为 真 时 控制 流 穿 越 到 stmt1i 

13) emitlabel(labeli); stmti.gen(labeli, a); emit("goto L" + a); 
14) emitlabel(label2); stmt2.gen(label2, a); 

15) } 

16) } 


一 个 While 对 象 的 构造 过 程 分 为 两 个 部 分 :构造 函数 While( ) 创 建 了 一 个 子 结 点 为 空 的 结 点 
(第 5 行 ); 初始 化 函数 int(x,s) 把 子 结 点 expr 设置 成 为 x, 把 子 结 点 stmt 设置 成 为 s( 第 6 ~9 
43). BB gen(b,a) 用 于 生成 三 地 址 代码 (第 10 ~16 行 )。 它 和 类 IE 中 的 相应 函数 gen( ) 在 本 质 
上 有 着 相通 之 处 。 不 同 之 处 在 于 标号 a 被 保存 在 字段 after 中 (第 11 行 ), A stmt 的 代码 之 后 紧 
跟着 一 个 目标 为 b 的 跳 转 指令 (第 15 行 )。 这 个 指令 使 得 while 循环 进入 下 一 次 迭代 。 


1) package inter; // 文件 While.java 
2) import symbols.*; 

3) public class While extends Stmt { 

4) Expr expr; Stmt stmt; 

5) public While() { expr = null; stmt = null; } 
6) public void init(Expr x, Stmt s) { 


7) expr = x; stmt = s; 

8) if( expr.type != Type.Bool ) expr.error("boolean required in while"); 
9) F} 

10) public void gen(int b, int a) { 

11) after = a; // 保存 标号 a 

12) expr.jumping(0, a); 

13) int label = newlabel(); // 用 于 stmt 的 标号 

14) emitlabel(label); stmt.gen(label, b); 

15) emit("goto L" + b); 

16) } 
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类 Do 和 类 While 非常 相似 。 


1) package inter; // 文件 Dojava 
2) import symbols.*; 


3) public class Do extends Stmt { 

4 Expr expr; Stmt stmt; 

5 public Do() { expr = null; stmt = null; } 

6) public void init(Stmt s, Expr x) { 

7) expr = x; stmt = s; 

8) if( expr.type != Type.Bool ) expr.error("boolean required in do"); 
9 } 

10) public void gen(int b, int a) { 

11 after = a; 

12 int label = newlabel(); // 用 于 expr 的 标号 
13) stmt.gen(b, label) ; 

14 emitlabel (label); 

15). expr. jumping(b,0); 

16 } 

17) } 





类 Set 实现 了 左 部 为 标识 符 且 右 部 为 一 个 表达 式 的 赋值 语句 。 在 类 Set 中 的 大 部 分 代码 的 
目的 是 构造 一 个 结 点 并 进行 类 型 检查 (第 5 ~ 13 17). KA gen 生成 一 个 三 地 址 指令 (第 14 





ae 16 fT) o 
1) package inter; // 文件 Set.java 
2) import lexer.*; import symbols.*; 
3) public class Set extends Stmt { 
4 public Id id; public Expr expr; 
5) public Set(Id i, Expr x) { 
6) id = i; expr = x; 
7) if ( check(id.type, expr.type) == null ) error("type error"); 
8 J 
9 public Type check(Type pi, Type p2) { 
10 if ( Type.numeric(p1) && Type.numeric(p2) ) return p2; 
1l else if ( pl == Type.Bool && p2 == Type.Bool ) return p2; 
12 else return null; 
13) 9 
14) public void gen(int b, int a) { 
15 emit( id.toString() + " = " + expr.gen().toString() ); 
16 } 
17) } 
类 SetElem 实现 了 对 数组 元 素 的 赋值 。 
1) package inter; // 文件 SetBlem.java 


2) import lexer.*; import symbols.*; 

3) public class SetElem extends Stmt { 

4) public Id array; public Expr index; public Expr expr; 
5) public SetElem(Access x, Expr y) { 


6) array = x.array; index = x.index; expr = y; 

7) if ( check(x.type, expr.type) == null ) error("type error"); 
8) } 

9) public Type check(Type p1, Type p2) { 

10) if ( p1 instanceof Array || p2 instanceof Array ) return null; 
11) else if ( pl == p2 ) return p2; : 

12) else if ( Type.numeric(p1) && Type.numeric(p2) ) return p2; 
13) else return null; 

14) } 


15) public void gen(int b, int a) { 


16) String s1 = index.reduce().toString() ; 

17) String s2 = expr.reduce().toString(); 

18) emit(array.toString() +" [ "+ s1+" ] =" + s2); 
19) } 
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类 Seq 实现 了 一 个 语句 序列 。 在 第 6 ~7 行 上 对 空 语句 的 测试 是 为 了 避免 使 用 标号 。 请 注 
意 ， 空 语句 Stmt .Null 不 会 产生 任何 代码 , 因为 类 Stmt 中 的 方法 gen 不 做 任何 处 理 。 


1) package inter; // 文件 Seq.java 

2) public class Seq extends Stmt { 

3) Stmt stmti; Stmt stmt2; 

4) public Seq(Stmt si, Stmt s2) { stmti = s1; stmt2 = s2; } 
5) public void gen(int b, int a) { 


6) if ( stmti == Stmt.Null ) stmt2.gen(b, a); 

7) else if ( stmt2 == Stmt.Null ) stmti.gen(b, a); 
8) else { 

9) int label = newlabel(); 

10) stmt1.gen(b, label); 

11) emitlabel(label); 

12) stmt2.gen(label,a) ; 

13) } 

14) } 

15) } 


一 个 break 语句 把 控制 流转 出 它 的 外 围 循环 或 外 围 switch 语句 。 类 Break 使 用 字段 stmt 来 
保存 它 的 外 围 语 旬 构造 (语法 分 析 器 保证 Stmt. Enclosing 了 其 外 围 构 造 对 应 的 语法 树 结 
点 ) 。 一 个 Break 对 象 的 代码 是 一 个 目标 为 标号 stmt.after 的 跳 转 指令 。 这 个 标号 标记 了 紧 
跟 在 stmt 的 代码 之 后 的 指令 。 


1) package inter; // 文件 Break.java 
2) public class Break extends Stmt { 

3) Stmt stmt; 

4) public Break() { 


5) if( Stmt.Enclosing ==Stmt. null ) error("unenclosed break"); 
6) stmt = Stmt.Enclosing; 

fi } 

8) public void gen(int b, int a) { 

9) emit( “goto L" + stmt.after); 

10) } 

11) } 


A. 8 ANARE 


语法 分 析 器 读 人 一 个 由 词法 单元 组 成 的 流 ,， 并 调用 适当 的 在 A.5 ~ A.7 节 中 讨论 的 构造 函 
数 , 构建 出 一 棵 抽象 语法 树 。 当 前 符号 表 按 照 2.7 节 中 图 2-38 的 翻译 方案 进行 处 理 。 
包 parser 包含 一 个 类 Parser; 


1) package parser; // 文件 Parser.java 

2) import java.io.*; import lexer.*; import symbols.*; import inter.*; 
3) public class Parser { 

4) private Lexer lex; // 这 个 语法 分 析 器 的 词法 分 析 器 

5) private Token look; // 向 前 看 词法 单元 

6) Env top = null; // 当前 或 顶层 的 符号 表 

7) int used = 0; // 用 于 变量 声明 的 存储 位 置 

8) public Parser(Lexer 1) throws IOException { lex = 1; move(); } 
9) void move() throws I0Exception { look = lex.scan(); } 





10) void error(String s) { throw new Error("near line "+lex.line+": "+s); } 
11) void match(int t) throws IOException { 

12) if( look.tag == t ) move(); 

13) else error("syntax error"); 

14) } 


和 2.5 节 中 的 简单 表达 式 的 翻译 器 类 似 , 类 Parser 对 每 个 非 终结 符号 有 一 个 过 程 。 消 除 
A. 1 节 中 源 语 言 文法 中 的 左 递归 后 可 以 得 到 一 个 新 的 文法 。 这 些 过 程 就 是 基于 这 个 新 文法 创 
建 的 。 
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语法 分 析 过 程 首先 调用 了 过 程 program, 这 个 过 程 又 沽 用 了 block( ) (38 16 行 ) 来 对 输入 
流 进行 语法 分 析 , 并 构建 出 抽象 语法 树 。 第 17 ~ 18 行 生成 了 中 间 代 码 。 


15) public void program() throws IOException { // program -> block 


16) Stmt s = block(); 

17) int begin = s.newlabel(); int after = s.newlabel(); 

18) s.emitlabel(begin); s.gen(begin, after); s.emitlabel(after); 
19) } 


对 符号 表 的 处 理 明确 显示 在 过 程 block PO, Rit top( 在 第 5 行 中 声明 ) 存放 了 最 顶层 的 
符号 表 , 变 量 saveaEnv( 第 21 行 ) 是 一 个 指向 前 面 的 符号 表 的 连接 。 


20) Stmt block() throws IOException { // block -> { decls stmts } 


21) match(’{’); Env savedEnv = top; top = new Env(top); 
22) decis(); Stmt s = stmts(); 

23) match(’}’); top = savedEnv; 

24) return s; 

25) } 


程序 中 的 声明 会 被 处 理 为 符号 表 中 有 关 标 识 符 的 条 上 是 ( 见 第 30 行 )。 昌 然 这 里 没有 显示 , 声 
明 还 可 能 生成 在 运行 时 刻 为 标识 符 保 留存 储 空间 的 指令 。 


26 void decls() throws I0Exception { 

27 while( look.tag == Tag.BASIC ) { // D -> type ID ; 

28 Type p = type(); Token tok = look; match(Tag.ID); match(’;’); 
29 Id id = new Id((Word)tok, p, used); 

30 top.put( tok, id ); 

31 used = used + p.width; 

32 } 

33 } 

34 Type type() throws TOException { 

35 Type p = (Type)look; // 期 望 1ook.tag == Tag.BASIC 
36 match(Tag.BASIC) ; 

37) if( look.tag != °[? ) return p; // T -> basic 

38 else return dims(p); // 返回 数组 类 型 

39 } 

40 Type dims(Type p) throws I0Exception { 

41 match(’[’); Token tok = look; match(Tag.NUM); match(’]’); 
42) if( look.tag == ? P? ) 

43) p = dims(p); 

44) return new Array(((Num)tok).value, p); 

45 } 





过 程 stmt 有 一 个 switch 语句 。 这 个 语句 的 各 个 case 分 支 对 应 于 非 终结 符号 Stmt 的 各 个 产 
生 式 。 每 个 case 分 支 都 使 用 A.7 节 中 讨论 的 构造 函数 来 建立 某 个 构造 对 应 的 结 点 。 当 语法 分 析 
器 碰 到 while 语句 和 do 语句 的 开始 关键 字 的 时 候 , 就 会 创建 这 些 语 句 的 结 点 。 这 些 结 点 在 相应 语 
句 进行 完 语 法 分 析 之 前 就 构造 出 来 , 这 可 以 使 得 任何 内 层 的 break 语句 回 指 到 它 的 外 层 循 环 请 
句 。 当 出 现 嵌 套 的 循环 时 ,我 们 通过 使 用 类 stmt 中 的 变量 Stmt. Enclosing 和 savedStmt 
(在 第 52 行 声明 ) 来 保存 当前 的 外 层 循环 的 。 


46) Stmt stmts() throws IOException { 


47) if ( look.tag == ’}’ ) return Stmt.Null; 

48) else return new Seq(stmt(), stmts()); 

49) } 

50) Stmt stmt() throws I0Exception { 

51) Expr x; Stmt s, si, s2; 

52) Stmt savedStmt; // FAY A break 语句 保 存 外 层 的 循环 语句 


O 另 一 种 很 具有 了 吸引 力 的 方法 是 向 类 Env 中 添加 方法 push 和 pop, 而 当前 的 符号 表 可 以 通过 一 个 静态 变 
基 Env .top 来 访问 。 
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53) switch( look.tag ) { 
54) case 737: 
55) move() ; 
- 56) return Stmt.Null; 
57) case Tag. IF: 
58) match(Tag.IF); match(’(’); x = bool(); match(’)’); 
59) sl = stmt(); 
60) if( look.tag != Tag.ELSE ) return new If(x, s1); 
61) match(Tag.ELSE) ; 
62) s2 = stmt(); 
63) return new Else(x, s1, s2); 
64) case Tag.WHILE: 
65) While whilenode = new While(); 
66) savedStmt = Stmt.Enclosing; Stmt.Enclosing = whilenode; 
67) match(Tag.WHILE); match(’(’); x = bool() ; match(’)’); 
68) si = stmt(); 
69) whilenode.init(x, s1); 
76) Stmt.Enclosing = savedStmt; // H Stmt.Enclosing 
71) return whilenode; 
72) case Tag.D0: 
73) Do donode = new Do(); 
74) savedStmt = Stmt.Enclosing; Stmt.Enclosing = donode; 
75) match(Tag.DO); 
76) si = stmt(); 
77) match(Tag. WHILE); match(’(’); x = bool(); match(’)’); match(’;’); 
78) donode.init(s1, x); 
79) Stmt.Enclosing = savedStmt; // Hifi Stmt.Enclosing 
80) return donode; 
81) case Tag.BREAK: 
82) match(Tag.BREAK); match(’;’); 
83) return new Break(); 
84) case ’{?: 
85) return block(); 
86) default: 
87) return assign(); 
88) } 
89) } 


为 方便 起 见 , 赋值 语句 的 代码 出 现在 一 个 辅助 过 程 assign 中 。 


90) Stmt assign() throws IOException { 


91) Stmt stmt; Token t = look; 

92) match(Tag.ID); 

93) Id id = top.get(t); 

94) if( id == null ) error(t.toString() + " undeclared"); 
95) if( look.tag == °=? ) { //S-> id =E; 
96) move(); stmt = new Set(id, bool()); 

97) } 

98) else { //S->L=E; 
99) Access x = offset(id); 

106) match(’=’); stmt = new SetElem(x, bool()); 
101) } 

102) match(’;’); 

103) return stmt; 

104) } 


对 算术 运算 和 布尔 表达 式 的 语法 分 析 很 相似 。 在 每 种 情况 下 都 会 创建 一 个 正确 的 抽象 语法 
树 结 点 。 如 A. 5 节 和 A.6 节 所 讨论 的 , 这 两 者 的 代码 生成 方法 有 所 不 同 。 


105) Expr bool() throws I0Exception { 


106) Expr x = join(); 

107) while( look.tag == Tag.OR ) { 

108) Token tok = look; move(); x = new Or(tok, x, join()); 
109) } 


110) return Xx; 
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111) 4 

112) Expr join() throws IOException { 

113 Expr x = equality(); 

114 while( look.tag == Tag.AND ) { 

115 Token tok = look; move(); x = new And(tok, x, equality(); 
116) } 

117 return x; 

118 } 

119) Expr equality() throws I0Exception { 

120 Expr x = rel(); 

121 while( look.tag == Tag.EQ || look.tag == Tag.NE ) { 

122 Token tok = look; move(); x = new Rel(tok, x, rel()); 
123) } 

124) return x; 

125) 了 

126) Expr rel() throws I0Exception { 

127) Expr x = expr(); 

128) switch( look.tag ) { 

129) case ’<’: case Tag.LE: case Tag.GE: case °>’: 

130) Token tok = look; move(); return new Rel(tok, x, expr()); 
131) default: 

132) return x; 

133) } 
“134) } 

135) Expr expr() throws IOException { 

136) Expr x = term(); 

137) while( look.tag == ’+’ || look.tag == ’~’ ) { 

138) Token tok = look; move(); x = new Arith(tok, x, term()); 
139) } 

140) return x; 

141 } 

142 Expr term() throws IOException { 

143 Expr x = unary(); 

144) while(look.tag == °»? |] look.tag == ’/’? ) { 

145 Token tok = look; move(); x = new Arith(tok, x, unary()); 
146 了 

147) return x; 

148) } 

149 Expr unary() throws I0Exception { 

150 if( look.tag == ’~’ ) { 

151 move(); return new Unary(Word.minus, unary()); 

152 } 

153 else if( look.tag == ?!? ) { 

154 Token tok = look; move(); return new Not(tok, unary()); 
155 } 

156) else return factor(); 

157) } 

FERED as PAAR RIGA RAR AF”. HRW offset 按照 6.4.3 节 中 讨论 的 

方法 为 数组 地 址 计算 生成 代码 。 

158) Expr factor() throws I0Exception { 

159) Expr x = null; 

160 switch( look.tag ) { 

161) case ’(’: 

162) move(); x = bool(); match(’)’); 

163 return x; 

164) case Tag.NUM: 

165 x = new Constant(look, Type.Int); move(); return x; 
166) case Tag.REAL: 

167) x = new Constant(look, Type.Float); move(); return x; 
168 case Tag. TRUE: 

169 x = Constant.True; move(); return x; 





170) case Tag.FALSE: 
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171) x = Constant .False; move(); return x; 
172) default: 

173) error("syntax error"); 

174) return x; 

75) case Tag. ID: 

176) String s = look.toString(); 

177) Id id = top.get (look) ; 

178) if( id == null ) error(look.toString() + " undeclared"); 
79) move(); 

80) if( look.tag != ’[’ ) return id; 

181) else return offset(id); 

82) } 

183) } 

184) Access offset(Id a) throws I0Exception { // I -> [E] | [E] I 
85) Expr i; Expr w; Expr t1, t2; Expr loc; // 继承 id 

86) Type type = a.type; 

187 match(’?[’); i = bool(); match(’]’); // 第 一 个 下 标 I->[E] 
188 type = ((Array)type) .of; 

189 w = new Constant(type.width) ; 

190 ti = new Arith(new Token(’*’), i, v); 

191 loc = ti; 

192 while( look.tag == > [? ) { // 多 维 下 标 I->[E]I 

193 match(’[’); i = bool(); match(’]’); 

194 type = ((Array) type) .of; 

195 w = new Constant(type.width) ; 

196 ti = new Arith(new Token(’*’), i, w); 

197 t2 = new Arith(new Token(’+’), loc, t1); 

198 loc = t2; 

199) } 

200 return new Access(a, loc, type); 

201 } 

202) } 


A.9 创建 前 端 


这 个 编译 器 的 各 个 包 的 代码 存放 在 五 个 目录 中 :main、lexer、symbols、parser 和 in- 
ter, 创建 编 译 器 的 命令 行 根据 系统 的 不 同 而 不 同 。 下 面 是 编译 器 的 UNIX 实现 : 

javac lexer/*.java 

javac symbols/*.java 

javac inter/*.java 

javac parser/*.java 

javac main/*.java 


上 面 的 javac 命令 为 每 个 类 创建 了 . class 文件 。 要 练习 使 用 我 们 的 翻译 器 , 只 需要 输入 
java main. Main, 后 面 跟 上 将 要 被 翻译 的 源 程序 ， 比 如 文件 test 中 的 内 容 : 


{ // 文件 test 
int i; int j; float v; float x; float[100] a; 
while( true ) { 
do i = i+1; while( ali] < v); 
do j = j-1; while( alj] > v); 
if( i >= j ) break; 
x = a[i]; a[i] = arj]; alj] = x; 


ONOMA U Ne 





} 

对 于 这 个 输入 , 这 个 前 端 输出 : 
Y i Op by Pac Se ee eS 

2) L5: tl=i* 8 

3) t2=a [t1] 


nou 
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4) if t2 < v goto L3 
5) L4: j=j-i 

6) L7: t3=sj>*8 

7) t4=a[t3] 

8) if t4 > v goto L4 
9) L6: iffalse i >= j goto L8 
10) L9: goto L2 

11) L8: t5 =i * 8 

12) x=a[t5] 

13) L10: +t6=i*8 

14) t7=j*8 

15) t8 =a [t7] 

16) a [t6 ] = t8 

17) L11: t9=j*8 

18) a[ft9]=x 

19) goto Li 

20) L2: 


尝试 一 下 。 


附录 B 寻找 线性 独立 解 


E 找 出 Az>0 的 最 大 的 线性 独立 解 集合 , 并 将 它们 表示 为 矩阵 B 的 各 行 。 

输入 : 一 个 M xN 的 矩阵 4。 

输出 : RAR SO 的 各 个 线性 独立 解 组 成 的 矩阵 Bo 

方法 : 算法 以 伪 代 码 的 方式 在 下 面 给 出 。 请 注意 ,XLy] 表 示 和 矩阵 的 第 y 行 , Xy: RRE 





MEX WS y ~2 4, 而 X[y: llu: 可 表示 矩阵 天 中 的 第 y ~z 行 及 第 ww~v 列 的 方块 。 口 
M = AT; 
to = 1; 
co = l; 


B= fns JE [7 Rx7U 的 单元 矩阵 */ 


while ( true ) { 


/* 1. 48M [ro ir’ - 1]jco se - 1) POM ABTA EKRE 
Re, HAWE MIr : nfc: m] = 0。 M[r’ : n] WAR. */ 
r! = ro; 
“= Co; 
while (存在 M[r][c] 40 ) 使 得 
7 一 7 和 ce 一 c 都 这 0) 荆 
通过 行列 互 换 ， 把 中 心 点 Ar]lo] 移动 到 MIr][e'] 
把 B PRI " 行 和 第 r ITER; 
if ( M[rJ[c’] <0) ¢ 
M[r'] = -1 + M[r']:; 
Bir'} = -1 * Bir’); 
} 
for (row = roton) { 
if (row Æ r’ and M[row][c'] 4 0) { 
u = —(M [row]le]/M [rie] 
M[row] = M[row] + u* Mr 
Blrow| = Blrow] + u * B[r’}; 


} 


/* 2. 找 出 AM fr! n] ZIAR, AR EE 
Mlro:1!~ leo : mm] 的 一 个 非 负 组 合 */ 
找 出 heyyy. kei 之 0 使 得 
kro M{rol[c’ : m] +--+ + kr- M[r’ - Ife! : m] > 0; 
if ( 如 果 存 在 一 个 非 平凡 解 ， 比 如 好 > 0) { 
MIr] = ky, Miro] +--+ + kp 1 M[r' - 1); 
NoMoreSoln = false; 
yelse /* M[r': n] 就 是 全 部 解 */ 
NoMoreSoln = true; 
/* 3. 使 得 Mro ira - Lleo : m) 20 */ 
if ( NoMoreSoln ) { /* 488% M[r' :可 移动 到 MIro:rn - 1] */ 
for (r=r' ton) 
交换 MA BAIA r 和 ro +r — 7; 
rn =T +n-—7' +15} 


else { /* 使 用 行 相 加 的 方法 来 找 出 更 多 的 解 */ 


寻找 线性 独立 解 631 





Tn = ntl; 
for (col = d tom) 
if ( 存在 M[row][col] < 0 使 得 row > ro ) 
if ( 存在 对 [站 [coj > 0 使 得 > 之 ro ) 
{ for (row = To tO rn~ 1) 
if ( M{row]{col] <0) { 

u = [(—Mf[row]fcol]/M[r}[col])]; 
M[row} = M[row] + u* MIr]; 
Blrow] = Blrow] + u* Bir}; 


} 
else 
for ( row = T — 1 to ro step -1 ) 
if ( M[row][col] < 0){ 
rn =Tn 一 Ti 
JEM [row] fl M {ra} 对 换 ; 
4E Blrow] Fn B[rn) 对 换 ; 


} 


/* 4. 使 得 Miro: rn- fl :co— 1] > 0 */ 
for (row = Tro tO Tn —1) 
for (col = 1 toc—1) 
if ( M[row]|[col] < 0 ){ 

选取 一 个 了 使 得 Mirllecol > 0 Br < ro; 
u = [(—M[row][col]/M[r][col])]; 
M[row] = M{row] + u* Mfr]; 
Blrow] = Blrow] + u* Bir]; 


/* 5. 如 果 有 必要 ， 对 MM[r;, : nj 中 的 各 行 重复 处 理 */ 
if (NoMoreSoln or rn > n or Tp == To) { 

M B PAIRA rn 到 Rn 各行 ; 

return B; 
} 
else { 

cn = m+); 

for ( col = m to 1 step -1 ) 

if ( RE M[r|[col] > 0 使 得 7 <ra) { 
cn = Cn- l; 


交换 M 中 的 第 col 列 和 第 cn 列 ; 


} 
Ta = Tn; 
Co = Cn; 


一 本 打开 的 书 ， 
-RFA 
2 EE RAN, 
托 起 一 流 人 才 的 基石 。 
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“ 它 本 来 是 作为 参考 书 撰写 的 ， 但 有 人 发 现 每 一 卷 都 可 以 饶 有 兴致 地 从 头 读 到 
尾 。 一 位 中 国 的 程序 员 甚 至 把 他 的 阅读 经 历 比 做 读 诗 。 如 果 你 认为 你 确实 是 一 个 
好 的 程序 员 ， 读 一 读 Knuth 的 《计算 机 程序 设计 艺术 》 吧 ， 要 是 你 真 把 它 读 通 了 ， 
你 就 可 以 给 我 递 简历 了 。” 





——- Bill Gates 
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